## 2010年7月22日星期四

### 八爪 Paul 與未來哥番外篇：Bin(n,p) 的 95% C.I.

Pr(X ≤ x | p = a) = α/2 及 Pr(X ≥ x | p = b) = α/2

Clopper-Pearson interval 又通稱為 exact interval，原因是它保證有不少於 95% 的覆蓋機率 (coverage probability)。若你未聽過覆蓋機率這個詞語，就表示你念大學時很可能並非專攻統計學。且讓我們複習一下甚麼叫 95% C.I.。如果 X 是一個隨機變數，其分佈取決於參數 p，那麼一個 X 的 95% C.I. 是一個隨機區間 (a(X), b(X))，其端點 a(X), b(X) 為只取決於 X 而非 p 的函數，而且：

Pr{ (a(X), b(X)) ∋ p } 的數值，就是隨機區間 (a(X), b(X)) 的所謂覆蓋機率，而所謂 95% C.I.，實際上就是一個覆蓋機率等於 0.95 的隨機區間。

fx(p) = C(n,x) px (1-p)n-x,  x=0,1,...,n,

δx(p) = 1 if a(x)< p < b(x), or 0 otherwise.

Pr{ (a(X), b(X)) ∋ p } = f0(p) δ0(p) + f1(p) δ1(p) + ... + fn(p) δn(p).

[a(0), b(0)) = [0, 0.3694),
(a(1), b(1)) = (0.0032, 0.5265),
(a(2), b(2)) = (0.0319, 0.6509),
(a(3), b(3)) = (0.0852, 0.7551),
(a(4), b(4)) = (0.1570, 0.8430),
(a(5), b(5)) = (0.2449, 0.9148),
(a(6), b(6)) = (0.3491, 0.9681),
(a(7), b(7)) = (0.4735, 0.9968),
(a(8), b(8)] = (0.6306, 1.0000].

X=0: [0, 0.95),
X=1: [0.05, 1],

X=0: [0, 0.975),
X=1: [0.025, 1],

X=0: [0, 0.3156),
X=1: (0.0063, 0.5001),
X=2: (0.0464, 0.6845),
X=3: (0.1111, 0.7108),
X=4: (0.1929, 0.8071),
X=5: (0.2892, 0.8889),
X=6: (0.3155, 0.9536),
X=7: (0.4999, 0.9937),
X=8: (0.6844, 1.0000].

[1] C.J. Clopper and E.S. Pearson (1934), The use of confidence or fiducial limits illustrated in the case of the binomial. Biometrika, 26(4): 404-413.
[2] 寫成 (a(X), b(X)) ∋ p 而不是 p ∈ (a(X), b(X))，是為了強調有關的事件為「隨機區間 (a,b) 覆蓋固定的點 p」，而非「隨機的 p 落在固定區間 (a,b) 當中」。）

## 2010年7月19日星期一

### Fred Rogers

Some public stations, as well as commercial stations, program the "Neighborhood" at hours when some children cannot use it ... I have always felt that with the advent of all of this new technology that allows people to tape the "Neighborhood" off-the-air, and I'm speaking for the "Neighborhood" because that's what I produce, that they then become much more active in the programming of their family's television life. Very frankly, I am opposed to people being programmed by others. My whole approach in broadcasting has always been "You are an important person just the way you are. You can make healthy decisions." Maybe I'm going on too long, but I just feel that anything that allows a person to be more active in the control of his or her life, in a healthy way, is important.

## 2010年7月16日星期五

### 八爪 Paul 與未來哥 (II)

MLE 是很好的工具，但它有其局限。我們不能因為 Paul 八測八中而推論 Paul 永遠不會估錯，這應該是常識。然而現今的學校，不少都只實行填鴨式教育，以致學生只懂得一頭裁進公式的深海，反而忽略了顯而易見的道理。以 Paul 的例子來說，八測八中，百測百中跟一測一中，p 的 MLE 都是 1，但很明顯的，在這三種不同情況底下，任何人對 Paul 的預測能力的信心，都會有很大分別。單純對 p 的數值作出估計是不夠的，我們還需要一個可以因應比賽的總場數而調整闊窄的 p 的範圍。簡單來說，我們需要的就是一個信賴區間 (confidence interval)。

Paul 的每場預測結果為 Bernoulli(p) 隨機變數，所以 n 場之後猜中的總數 X 循 Binomial(n,p) 分佈。現在 Paul 八測八中，無論是 MLE 抑或 unbiased estimate，p 的 point estimate 都是 1。現在我們問：如果我們認為 p 的真正數值 p0 沒有 1 那麼大，那我們可否用 5% 的顯著度去否定 H0: p≤ p0 這個命題？

## 2010年7月13日星期二

### 八爪 Paul 與未來哥 (I)

(p0 - 1.96 sqrt(p0(1-p0)/n), p0 - 1.96 sqrt(p0(1-p0)/n))。

## 2010年7月3日星期六

### 人貼我又貼

Hmm, 我是覺得好好笑的，不過大概要寫電腦程式的朋友才明白箇中笑點。片段最後有少量成人情節，未成年者慎入。

Vivek Mahbubani