2008年9月11日星期四

N 個人,N 種分析

選舉過後,各吹水名家自然各有各的分析,秉承「我地就係吹水」的宗旨,Alone in the Fart 舉辦了第一屆「立法會選舉:量化或圖像化分析大賽」,在眾多以數字和圖表為主的分析當中,選出在某幾方面有突出成就的文章。經過一番不知有多激烈的提名及攪盡腦汁的評審之後,以下是得獎結果。各得獎者可在下次中國再舉辦奧運之前,領取本網主充滿體香、從未洗過的宅男內褲一條。

我地就係吹水!Yeah,去片!

I) 最一目了然大獎 — 梁啟智:立法會研究 2008Car and Pier blog,9 月 10 日
梁啟智用地圖軟件把各選選名單的得票數目用圖像表現出來,一目了然,例如按他所說,上圖顯示「毓民的票不只來自基層區,中產區一樣有,贏得清脆。」其他圖表亦顯示最受「西環」支持的原來不是民建聯,而是公民黨

II) 最有創意大獎 — Chainsaw Riot:立會選舉一張圖1-555-CONFIDE blog,9 月 10 日

Chainsaw 可說是香港一眾博客中最懂得深入淺出、言簡意賅地用統計方法去解釋社會現像的人。不過這次並不是用統計,而是用信息理論 (Information Theory) 中的熵 (entropy) 去分析選民投票的平均程度與泛民在立法會中的議席比率之間的關係。
如上圖。縱軸是比起 2004 年,2008 年泛民在立法會中所增加的議席比率(負數代表議席減少),橫軸是兩屆選舉投票的 evenness index (e) 之差。粗略地說,evenness index 是由每區各名單的得票率所計算出的熵數 H 與 n ln(n) (n 為該區名單數目)之比 (that is, e = H/[n ln(n)])。H 值在信息理論中是用來測量事物無序性或信息含量的標準,H 越高,表示越沒秩序,或者信息含量越低。在選舉中,如果投個個候選人也差不多,候選名單便缺乏獨特性,也就是說名單並不能給予選民多少信息,這樣,投票便變得沒秩序、較為隨機,各名單的得票率也較平均,H 值也較高。所以 H 可用來測量得票的平均性。把 H 除以 n ln(n),令有不同名單數目的各區也可作比較,是規範化 (normalisation) 的手段。 數學上,可以證明 e = H/[n ln(n)] ≤ 1,這樣,e 越接近 1,投票越平均。

不過這個研究方法始終未成熟, Chainsaw 的分析也有點瑕疵。首先是命題有點含糊,作者說此分析的目的在於展示「今次泛民配票成功,獲得更多的地區議席」,但他實際嘗試展示的卻是「今次泛民得票比較平均,獲得更多的地區議席」。當然,甚麼叫「配票」沒有公認的定義,一般巿民隨機投票,也可以被認為是選民「自行配票」。無論如何,把研究的命題弄得精確一些較好。

其次是縱軸的尺度有點兒誤導。以九龍東為例,此區只有 4 個議席。泛民如果多/少佔一個議席,所佔議度的比率差便會改變 25 個百分點。所以圖中五區在縱軸上的數字雖然看似相差很遠(由 -15% 到 +17% 不等),但實際上只是多一個或少一個議席之差。

此外,Chainsaw 雖然想顯示泛民得票較以往平均,令他們獲得更多地區議席,但如果只看上圖右方的三個藍點,便會得出截然不同的結論:在港島和兩個新界選區,evenness index 越高,泛民所得議席反而越低。到底這是否表示有一個臨界的 evenness index 存在,便要更深入的研究了。

最後,我也有點懷疑 Chainsaw 的研究方法有幾 robust。要知道泛民所得的議席數除了與泛民陣營的得票率有關之外,與名單的組合也有關連,而 2004 年的名單組合又顯然與 08 年的不同,但 Chainsaw 的研究並沒有去除這個因素。

儘管有上述的種種瑕疵,能想到把熵數用在選舉分析,並細心地把這個量規範化,實在極富創意,值得一讚。

III) 最求其大獎 — 李先知:哪家大學立會民調最準,《明報》,9 月 10 日

這篇文章的目的在於比較三家大學的民調準確度,按作者自己的說法:
筆者所用的統計方法,是先按上述3項民調的結果,排列出入圍候選人的當選次序,然後跟最後點票結果所得的真實排名次序逐一比較。例如某甲在某區民調所得的支持度位列第一,但在最終的點票結果卻排名第四,那麼其偏誤度便是3(4減1)。接著,又把民調顯示會當選的每名候選人的偏誤度加起來,便可反映這個機構針對該區進行的民調的準確度。
在批評這篇文章的研究方法之前,先說幾點較不重要的事。第一,雖然作者自稱用「統計方法」,但實際上只是算術,沒有統計學的內涵。第二,留意作者關心的是民調的準確度,而不是三家機構做民調的勝任程度。假設 A、B 兩所機構的預測得票率完全一樣,但 A 機構的樣本數只是 B 機構的十分一,那麼兩個民調雖然同樣準確,但 A 機構顯然比 B 機構做得更好。第三,此文章的標題為《哪家大學立會民調最準》,但文章的後半卻集中批評港大的票站調查不夠準確,這其實是兩個不同問題。

回說文章的研究方法。要比較得有意義,三家機構做滾動調查的時窗須大致相同。李先知說用的是《明報》九月五日刊登的資料,我沒有買《明報》,暫且假設這方面沒有問題。要比較民調的準確度,我們需要一個準則。這是很主觀的事,在大多數情況下,我們只可說某人所用的準則有某些缺點,但不可以說這個準則錯。現在的情形,就是李先知所用的準則很有問題。假設有五張名單爭奪三個議席,而 A、B 兩所機構預測的排名及得票率如下:
*  1  2  3 | 4 5 (actual ranking)
* 31 30 29 | 6 4 (actual percentage of votes)
* 2 3 1 | 5 4 (ranking predicted by A)
* 31 30 29 | 6 4 (% votes predicted by A)
* 2 3 4 | 1 5 (ranking predicted by B)
* 31 30 29 | 6 4 (% votes predicted by B)
以李先知的算法,兩份預測的偏誤都是 6,應該是同樣好的預測,可是 A 機構的民調無論是在得票率抑或實在所得議席方面都比 B 民調準確。選民看民調結果,是關心各名單最後能爭取到多少議席;政黨看民調結果,目的可以是宋以朗先生話齋,要適當地調兵去 get out the votes,也可以是如很多人所想,是用來配票,無論目的為何,要看的是預測的得票率,而不是各名單的排名。李先知以這個「排名偏誤」來量度民調的準確程度,但解釋不出為甚麼這個準則合理。

李先知的算法的另一個問題,是當幾張名單叮噹馬頭的時候,排名偏誤對得票率異常敏感。以上述 A 機構的民調為例,其結果(無論是得票率或各名單所得議席數)與實際的非常接近,但排名偏誤卻不小。使用排名偏誤來量度民調準確性的話,很容易過份放大調查的失誤程度。

IV) 獎你兩巴掌 — The suffocated, in Alone in the Fart blog,9 月 11 日

破而不立,當然抵打。總之,如上文有得罪之處,請各路英雄多多包涵。再來一次:我地就係吹水!Yeah!

3 則留言:

Unknown 說...

無錯,進身吹水名家之列,除了吹水,也要劃圖。是次我的所謂分析,是「麒麟球」(倒讀) do 。我都覺得有問題。榮獲最有創意大獎,實在榮幸!最麒麟球大獎,我都拿到一個杯耳,怎料被李先知勝出一個馬鼻,飲恨也!
p.s. 我係電鋸。

sam 說...

恭喜各位得獎者! 請網主儘快公佈領獎詳情,讓各得獎者能享用宅男內褲。如果網主獎品未足供應所有得獎者,請聯絡小弟...

The suffocated 說...

chung-hong,

原來是電鋸兄嗎?你的藝名還真多的。

雖說是「麒麟球」,但也不是信手拈來,箇中艱苦,應該不足為外人道吧。這點李先知也一樣,不過他勝出是實至名歸的,始終報人有趕稿的苦況,沒靈感的時候也要搓 his breast 找東西來寫,所以對不起了,閣下何止被拋離一個馬鼻,直情係幾個身位!

sam,

獎品早就準備好了,埋在 long. 114.268, lat. 22.3 附近方圓二百五十米內的地方。只要得獎者來信,大會便會送上藏寶圖一張。暫時獎品仍很充足,真的不夠的話,就要看兄弟你有多少男人味了,嘿~嘿~~。