next up previous contents
下一頁: The Multinomial Distribution 多項式分配 上一頁: Discrete Random Variable and 前一頁: Mean and Variance 平均值和變異數   目 錄

The Binomial Distribution 二項式分配

在這小節裡,我們將討論隨機離散的變數,其模式為在一定數目下的試驗 裡成功的次數。假如你比較喜歡做重複的試驗,而每一次試驗的結果 只有成功或失敗的可能而已。 這每次的試驗為獨立的,且我們假設成功的機率為 p, 我們定義隨機變數 Xk, k = 1, 2,...n

Xk = \begin{displaymath}\begin{cases}1 & \text{假如第 $k$ 次試驗為成功時} \\
0 & \text{其它情形}
\end{cases}\end{displaymath}

則, P(Xk = 1) = p = 1 - P(Xk = 0) 當 k = 1, 2,...n

假如做重複的試驗 n 次,我們希望可以知道成功的總次數。我們令

Sn = 於 $n$ 次試驗中成功的總次數

我們可以以隨機變數 Xk 來定義 Sn,即

Sn = $\displaystyle \sum_{k-1}^{n}$Xk

因為每一次試驗都是獨立的,我們有 Sn 可以寫為 n 個獨立的隨機變數的和, 且每一個隨機變數都是相同的。我們接下來將使用連續的使用此表示式。

隨機變數 Sn 為離散的,且其可能值為 0, 1, 2,..., n 為了找尋它的機率密度函數 p(k) = P(Sn = k),我們做如下的討論。 事件 {Sn = k} 可以被表示為一長度為 n 的且其值為 0 或 1 的數串, 其中 0 表示失敗, 1 表示成功,比如說, 假如 n = 5, k = 3, 則 01101 可以被解讀為 5 次試驗的結果,分別是 失敗,然後兩次成功,然後失敗,最後一次為成功。 這特定的結果的機率很容易被計算,因為每一次試驗都是獨立的。我們發現

P(01101) = (1 - p)pp(1 - p)p = p3(1 - p)2

這結果 01101 並非是唯一可能的結果當我們做五次試驗其中三次為成功時。 任何 長度為 5 且恰好有三個 1 與兩個 0 的的數串皆有相同的性質。 為了決定究竟有多少不同的數串具備此性質,備註,總共有 $ \begin{pmatrix}
5\\  3 \\
\end{pmatrix}$ 種可能性,當我們將三個 1 放於 5 個空的位置上,且恰好僅有一種可能性 將兩個 0 放在剩餘的的兩個位置上。 所以,總共有 $ \begin{pmatrix}
5\\  3 \\
\end{pmatrix}$ . 1 = $ \begin{pmatrix}
5\\  3 \\
\end{pmatrix}$ 不同的方式來處理長度為 5 的且恰好有 3 個 1 的數串。 如下,我們還有另一方法可以來計算, 總共有 5! 來放三個 1 和兩個 0,假如我們將所有的 0 與 1 視為皆相異的。 因為這些 0 與 1 可以重新排列與組合且不會影響它們的結論,我們必須除以它們的順序。 於是我們發現總共有,

$\displaystyle {\frac{5!}{3!2!}}$ = $\displaystyle \begin{pmatrix}
5\\  3 \\
\end{pmatrix}$

不同的結果。因為每一種結果均為相同的可能性,我們發現

P(S5 = 3) = $\displaystyle \begin{pmatrix}
5\\  3 \\
\end{pmatrix}$p3(1 - p)2

我們可以用相同的論述來導出更一般性的公式,我們總結如下


二項式分佈 (Binomial Distribution)     Sn 計算於 n 次獨立試驗中成功的總次數的隨機變數, 每一次成功的機率皆為 p,則二項式分佈可以被敘述為

P(Sn = k) = $\displaystyle \begin{pmatrix}
n\\  k \\
\end{pmatrix}$pk(1 - p)n - k,        k = 1, 2,..., n


假如我們利用於(12.18)關於隨機變數 Sn 的表示式,即 Sn = $ \sum_{k=1}^{n}$Xk, 我們可以非常直接的計算它的期望值與變異數。我們發現,

EX1 = (1)p + (0)(1 - p) = p

因為所有的 Xk, k = 1, 2,..., n,都有相同的分佈,我們發現,

ESn = E$\displaystyle \sum_{k=1}^{n}$Xk = $\displaystyle \sum_{k=1}^{n}$EXk = np

又因為這些 Xk 為獨立的,

var(Sn) = var$\displaystyle \left(\vphantom{\sum_{k=1}^nX_k }\right.$$\displaystyle \sum_{k=1}^{n}$Xk$\displaystyle \left.\vphantom{\sum_{k=1}^nX_k }\right)$ = $\displaystyle \sum_{k=1}^{n}$var(Xk) = np(1 - p)

我們在給定兩個例子關於二項式分佈的應用,為了更瞭解 其它的相關分佈的情形,這二項式分佈扮演一個非常重要的角色。



例題 5     我們再次的考慮豌豆開花的例子。假設 20 個互相獨立的後裔 由 Cc×Cc 所交配。求最多 2 個後裔開白色花的機率。 計算開白花的期望值與變異數。


解     Cc×Cc 所交配,後裔開白色花的機率為 1/4 後裔開紅色花的機率 為 3/4. 後裔的花色彼此間為獨立。 我們於是可以將此想像為 20 次試驗,每一次成功的機率為 1/4. 我們要求最多 2 個後裔開白色花的機率。當 n = 20, k$ \le$2 和 p = 1/4,我們發現,

\begin{displaymath}\begin{aligned}
P(S_{20}\le 2) &=P(S_{20}= 2)+P(S_{20}=1 )+P(...
...ht )^2\left(\frac 34\right)^{18}\\
& =0.0913\\
\end{aligned}\end{displaymath}

開白花的期望值為

ES20 = (20)$\displaystyle \left(\vphantom{\frac 14}\right.$$\displaystyle {\textstyle\frac{1}{4}}$$\displaystyle \left.\vphantom{\frac 14}\right)$ = 5

開白花的變異數為

var(S20) = (20)$\displaystyle \left(\vphantom{\frac 14}\right.$$\displaystyle {\textstyle\frac{1}{4}}$$\displaystyle \left.\vphantom{\frac 14}\right)$$\displaystyle \left(\vphantom{\frac 34}\right.$$\displaystyle {\textstyle\frac{3}{4}}$$\displaystyle \left.\vphantom{\frac 34}\right)$ = $\displaystyle {\textstyle\frac{15}{4}}$ = 3.75



例題 6     假設一個女性為血友病的帶原者, 與一個男性不是血友病的帶原者有 4 個女兒。求最少有一個女兒 帶有血友病基因的機率為何?


解    每一個女兒 帶有血友病基因的機率為 1/2, 且每一個發生的機率皆為獨立的。 我們於是可以將此想像為 4 次試驗,每一次成功的機率為 1/2. (成功的意思是帶有血友病基因) 所以

\begin{displaymath}\begin{aligned}
P(S_{4}\ge 1) &=1-P(S_{4}= 0)\\
& =1- \begi...
...{4}\\
& =1-\frac 1{16}=\frac {15}{16}=0.9375\\
\end{aligned}\end{displaymath}


next up previous contents
下一頁: The Multinomial Distribution 多項式分配 上一頁: Discrete Random Variable and 前一頁: Mean and Variance 平均值和變異數   目 錄
math 2005-08-16