2010年7月13日星期二

八爪 Paul 與未來哥 (I)

昨天正在想要不要吹水講下未來哥,見電鋸正好發新文講 Paul the Octopus,於是決定加把嘴。

用統計學來分析未來哥或者八爪魚 Paul 是神燈抑或神棍,嚴格來說是行不通的。整個統計推論 (statistical inference) 的基礎,是要有可以視為條件相同的重複實驗。然而世界盃每場的條件都不同,就算將來某一日 FIFA 改制,西班牙跟荷蘭的決賽要鬥 99 場,但是每場雙方的陣容與部署都可能不同,球員狀態、場地天氣等等因素更不在話下。當八爪魚 Paul 八測八中,實際上並非重複了八次同樣的實驗結果,而是做了八個完全不同的實驗。這八場賽事當中,雙方有時實力懸殊,有時旗鼓相當,故此預測的難度亦有別。將各場賽事視為 i.i.d. (identically and independently distributed) 的隨機變數,並不妥當。

話雖如此,利用這個 i.i.d. 的假設,也可以看出一些端倪。

電視台的新聞報道,一般都用擲銀幣的模型去看八爪魚 Paul 的預測,也就是如果 Paul 是亂猜,或猜中的機會率是 p=1/2,那麼八測八中的機會率,是 p 的八次方,亦即 1/256 = 0.39%。由於這個機會率實在太細,所以 Paul 的表現,肯定比亂猜要好。

撇除 i.i.d. 這個隱藏假設不說,若要說「八爪魚 Paul 的預測並非亂猜」,那麼眼前的証據還算有說服力,然而,若我們要考究的是八爪魚 Paul 的預測能力有多高,那前述的分析就不管用了,因為我們想估計的是 p 有多高,而不是 "p>1/2" 這個命題。就算是常人,估波估中的機會率,相信一般都略高於 1/2,所以純粹說 "p>1/2",也沒甚麼了不起。

要從猜中結果的世界盃場次數目推斷 p,貌似簡單,但實際上陷阱處處,正好作為大一統計課的範例。

於 i.i.d. 的假設之下,一般學生都會直覺地運用 maximum likelihood estimation (MLE)。由於每場預測都是一個 Bernoulli(p) 的實驗,因此 n 場賽事之中猜中 X 場(為求簡單,不妨假設分組賽不會打和),p 的 MLE 就是 X/n。對八爪魚 Paul 來說,X=n=8,因此 p=1。

此時, 若是不求甚解的學生,大概就會接納 p=1 這個結論。然而 Bernoulli(p) 是離散 (discrete) 而非連續 (continuous) 的隨機變數。若是連續分佈,即使對某個事件 E 來說有 Pr(E)=1,"not E" 這個事件還是有可能的(儘管機會率為零),但換了是有限的離散分佈,機會率為零的事件是絕不可能發生的。因此,若八爪魚 Paul 猜中的機會率為 1,那等於說 Paul 永遠都不會猜錯。這顯然不妥。

心思較細密的學生,可能會想起 p=1 只是一個 point estimate。由於 point estimate 不考慮統計誤差,因此較佳的做法是用 interval estimate,也就是與其說 p 是幾多,不如說 p 落在某個信賴區間 (confidence interval, C.I.) 之內。時下世界各地的大學都有教育經費問題,因此一般教科書都只是「淺入淺出」,凡是講 MLE 的 confidence interval,都是一招了,只講漸近常態分佈 (asymptotic normal approximation),還直接印出幾個常用統計分佈的 MLE 的 asymptotic variance 就算,對它們是怎樣計算出來 (亦即 Fisher information matrix 的概念) 隻字不提,幸而對 Bernoulli 分佈來說,p 的 MLE 的漸近常態分佈問題可以化為 Binomial distribution 的漸近分佈問題,是一般大一(甚至我念中學時的中學預科)都有教的簡單例子。總括來說,p 的 MLE 是 p0 = X/n,而 X/n 又漸近於 N(p; p(1-p)/n),因此若從觀察所得的猜中率為 p0 = x/n,那麼 p 的 95% C.I. 為
(p0 - 1.96 sqrt(p0(1-p0)/n), p0 - 1.96 sqrt(p0(1-p0)/n))。

然而此處又舐野。由於 MLE p0 =1,所以其二次方差 (variance) p0(1-p0)/n = 0,亦即是說,point estimate 跟 interval estimate 根本無分別,兩者結果都是 1,認真大鑊。你話點搞?

吹吹下又寫了咁多,下篇再續。

沒有留言:

發佈留言