2008年12月19日星期五

數字遊戲兩則

今天從《東南西北》網誌看到兩則和數字有關的消息,非常有趣(……至少對我這類人來說),不妨又吹吹水。

(I) 為甚麼地震預報總是虛報的多
Amsel 在《新語絲》寫的从概率角度看地震预报(二),寫得不錯,不過它的前篇从概率角度看地震预报(一)寫得更好。作者在《从(一)》用簡單的概率論解釋為甚麼地震預報的虛報率總是那麼高,我覺得他的解釋還可以寫得簡單一點。

大部份地震預報都依靠某些異常徵兆,例如地殼應力變化、前震,甚至一些較富爭議(或偽科學色彩較濃)的天文大潮、磁暴、天罕、星相組合等等。用中六統計學教的全概率公式,我們有
成功預報率 = P(震|兆)
= P(兆|震)P(震) / [P(兆|震)P(震) + P(兆|無震)P(無震)]
由於式子右邊各項全是正數,因此 P(兆|震) 愈大,成功預報率愈高。假設有一種很理想的徵兆,敏感得讓 P(兆|震) ≈ 1。一般人關心的大地震,發生的概率極小,也就是說 P(震) ≈ 0,或 P(無震) ≈ 1,因此 P(兆) = P(兆|震)P(震) + P(兆|無震)P(無震) ≈ P(兆|無震),而把上面成功預報率公式右邊的分子分母同時除以 P(震),可得
成功預報率 ≈ 1 / [1 + P(兆)/P(震)]
如果 P(兆) 比 P(震) 大兩級的話,譬如 P(兆)/P(震) = 100,那麼成功預報率頂多只有 1%,或者虛報率有 99%。若要有 50% 左右的成功預報率,P(兆) 的大小最多只能與 P(震) 同級 (at most of the same order of magnitude)。換句話說,要地震預報所用的徵兆可靠,除了要它對地震的敏感度高之外這種徵兆亦差不多要與大地震同樣罕見。這解釋了為甚麼很多日常生活中久不久出現的現象(如月圓月缺,請看《从(二)》)難以用來預測幾十年才出現一次的大地震。

相關連結:
从概率角度看地震预报(一)
从概率角度看地震预报(二)
从概率角度看地震预报(三)

(II) 為甚麼《成報》的讀者(而不是僱員)那麼滿意
浸會大學傳理學院最近公佈了一項關於香港新聞媒介表現的研究報告。這研究可議之處甚多,例如報告稱研究目的為「深入瞭解香港新聞媒介整體表現」,但三份主要的免費報章(《都巿日報》、AM 730 及《頭條日報》)竟然沒被列入研究當中;調查讀者的公信力標準時,亦只考慮「準確報道」、「平衡報道」及「全面多元」三種因素,而不考慮報章有沒有做 investigative reporting。公信力不單來自持平報道,還來自報社主動監察權貴的勇氣。不過這項研究亦有值得讚賞的地方,例如研究人員肯細心地數算各報章報道了多了各類型的新聞,以及點算多少條標題含主觀判斷字眼,這些都相當耗費人力。

結果方面,有的並不令人意外,例如《明報》又被視為公信力第一(該報也大幅報道這項調查);有些結果卻出人意表,例如最常表達不同觀點的報章原來是《英文虎報》。不過以下談的都不是這些,而是報告內這個表:





















































報紙名稱讀者比例 (%)滿意度
成報0.7%6.27
信報2.0%5.85
星島日報3.8%5.62
經濟日報2.3%5.59
南華早報0.8%5.28
明報7.8%5.09
東方日報29.0%5.08
太陽報5.3%4.99
蘋果日報30.4%4.94

(滿意度由 1 至 7 分,越高表示越滿意;訪問人數:N=1001)

公園仔說:『[明報]報導說,香港市民主要的讀報原因是「習慣」,而且他們的「習慣」,是閱讀自己不滿意的報章,讀者滿意度愈低的,愈多讀者。你還有甚麼話好說呢。』

東南西北》的宋以朗先生倒有話好說。他為這個現象作了有力的解釋,我感到相當信服,不過我這個網誌是為吹水而吹水,所以不妨探討一些另類想法。

一個想法是這樣的。所謂「滿意度」,人人理解不同。讀者多的話,不同理解之間的差異也許會因為取平均分而消失,但是讀者少的時候,他們對「滿意度」這個詞語的特殊理解便可能歪曲研究結果。

這不是無的放矢,事實上我有證據。訪問員要求受訪者為滿意度打分,由 1 至 7。正常人都會打整數分吧,較挑剔的也會以半分為單位,打一些諸如 4.5 分等等的分數。上表有 1001 位受訪者,《成報》讀者佔 0.7%,也就是得七個。假設這七人所打的分數都是以半分為單位,我用電腦檢查過,根本沒有一個組合會給出 6.27 (四捨五入至小數點後兩個位)的平均分。換句話說,若不是研究報告打錯字,便是《成報》的讀者中有想法很奇怪的傢伙。《南華早報》的情況都一樣。

另一個想法和所謂的 quantisation error 有關。如果人人都打整數分,那麼當心中的滿意度介乎 5 至 6 分之間,便會打 5 或 6 分,因此會有一個誤差 X。我們不妨簡單地假設 P(X = −0.5) = 0.25, P(X = 0) = 0.5, P(X = 0.5) = 0.25。當然,當滿意度是 1 分(或 7 分)時,X 不可能是 −0.5(或 0.5),不過這個應該影響不大。利用中六的統計學,我們可以計算一份報章的讀者滿意度是否顯著高於另一份報章的。詳情不提了,只說結果。以 5% 的顯著度 (significance level) 而言,
  • 《星島日報》的讀者滿意度並不顯著高於《經濟日報》的;
  • 《明報》的讀者滿意度並不顯著高於《東方日報》的;
  • 《明報》的讀者滿意度並不顯著高於《太陽報》的;
  • 《太陽報》的讀者滿意度並不顯著高於《蘋果日報》的。
(有趣的是同系的《東方日報》與《太陽報》雖然有時會共用新聞與評論,但兩報的讀者滿意度卻有顯著的統計差異。)
見圖。雖然整體上,讀者愈多滿意度愈低,但是對擁有多於 5% 的讀者的那批報紙(紅圈),或餘下的另一批報紙(綠圈),讀者人數與讀者滿意度並沒有清楚的關係。

後記:
以前曾替一位英國少女補習數學,發覺她太依賴計數機,一些分數的計算,如 4 × 2/3 等等,明明有十分簡單的答案 (8/3),但她總要用計數機算出小數答案 (e.g. 2.67),當時我感嘆新一代的學生只曉依賴機器,不懂深究計算背後的原理。誰知今天自己也淪落到這個地步。

如果七個人都以半分為單位打分,其麼其平均分只能是 1/14 的倍數。《成報》的讀者滿意度為 6.27,而最接近 6.27 的 1/14 的倍數只有 6 + 3/14 = 6.2142857142857... 及 6 + 4/14 = 6.2857142857142...。很明顯,兩者四捨五入至小數後兩個位都不是 6.27,根本不需要用電腦檢查所有分數組合。

沒有留言: