早陣子有很多關於地震預報的講法,網上亦流傳著有關的學術論文。一般人(包括我)不懂地震學,不知該信這些說法還是不信好。但正如五音不全的人亦能判斷歌手唱腔的好壞,有時只要夠耐性和細心,無須懂得高深的知識也能看出一些說法的不合理之處。
以下我會選一篇從《東南西北》看到的論文來解釋我的意思。雖然大家很關心地震預報的可能性,但為求方便,我揀的這篇文章並非關於如何預測地震,而是講如何評核地震預測的表現。其實宋以朗先生在他的網誌已經對此文作出了很恰當的批評,但我也不妨來個狗尾續貂,補充一下。
這篇文章的作者為陳學忠、陳佩燕及王林瑛,題為《對近年來地震危險區預測效果的評估》。每年初,中國地震局地球物理所都會列出一份有地震危險地區的名單。如果年內在這些「危險區」確有五級或以上的地震發生,那麼該項預測便算成功。當然,如果我把中國全境都劃為危險區的話,那麼這個預測幾乎必會命中,所以危險區劃得太大是沒意思的;可是劃得太小,又難以命中。要量度這些「危險區」定得好不好,需要有一個能夠量化的準則。
陳學忠等人就是嘗試用一個稱為「R值」的東西來做評核的標準。舉例來說,假設中國是一塊可以劃作 10 × 10 網格的土地:
如果我於年頭勾出了三塊長方形危險區(圖中綠色部份),而本年又在全國的八個網格(紅色部份)發生地震,那樣R值是這樣計算的:
設
A 為所考慮地區的總面積(以網格為單位,在本例中為 100),
AR 為劃定危險區的總面積(綠色部份,在本例中為 31),
AQ 為地震區的總面積(紅色網格,在本例中為 8),
n 為落在危險區中的地震網格數目(在綠色區域中的紅色格子,在本例中共 5 格)。
(註:在原文中,A, AR 和 AQ 的符號為 N, N1 跟 N1,因太混亂,故改用現在的符號。)
那樣
R = (n/AQ) - (AR-n)/(A-AQ)。
在本例中 R = (5/8) - (31-5)/(100-8) = 0.3424。當然,在現實中中國的領土及預估的危險區都不是長方形 ,但 R 的算法沒變。患有「恐數症」的朋友可能會咕嘀為甚麼 R 值的公式要如此設計,不過這裏我就不談了,只可以說,理論上,R 值最大為 1,而且 R 值愈高,代表危險區愈勾得準。地震局地球物理所把全國(不包括西藏地區)分成 972 個網格,其中西部地區佔了 517 個。以下是從 2001 至 2004 年,地震局地球物理所為全國及西部地區所劃的危險區的 R 值:
年度 | AR | AQ | n | R |
2001 | 111 | 16 | 6 | 0.265 |
2002 | 148 | 9 | 3 | 0.182 |
2003 | 84 | 16 | 6 | 0.293 |
2004 | 98 | 12 | 6 | 0.404 |
年度 | AR | AQ | n | R |
2001 | 78 | 16 | 6 | 0.231 |
2002 | 117 | 9 | 3 | 0.109 |
2003 | 63 | 15 | 6 | 0.286 |
2004 | 77 | 11 | 6 | 0.405 |
從這兩個表看來,這幾年的 R 值大致上在上升,似乎地震局的預報工作做得愈來愈好。
但真的是這樣嗎?
毋須精通地理或數學,只要夠細心,你便會發現以上的列表有個大問題。雖然上表好像給出了許多數據,但有時重要的不止是「看見甚麼」,還有「沒看見甚麼」。表 5 和表 6 列出了全國及西部的數據,但東部的呢?從這兩個表,其實可以推出東部的數字:
年度 | AR | AQ | n | R |
2001 | 33 | 0 | 0 | N/A |
2002 | 31 | 0 | 0 | N/A |
2003 | 21 | 1 | 0 | -0.046 |
2004 | 21 | 1 | 0 | -0.046 |
覺得怎樣?無論怎看也不算差吧。雖然每年關於東部的預測皆落空,但實際上頂多是沒有命中一次地震而已。可是 R 在此處卻是負數。這正正暴露了 R 值的缺點,就是我們不知應該用甚麼尺度來量度 R 值。就好像用五千萬元來賺一百萬, 跟用五十萬來賺一百萬很不同這個道理一樣,R 值每升 0.1,並不代表同等的進步。在表 5 和表 6 中,雖然 2004 年的 R 值比其餘三年的為大,但它究竟是否已高到令人滿意的地步?此外,從 2002 到 2004 年 R 值的變化,到底是顯著的進步,還是很輕易便能達到的結果?
為了解答這些問題,陳等人假設地震在全國各個網格有均等的發生機會。然後,利用模擬實驗,他們發現在同等的地震數目 AQ 和同等的危險區面積 AR 下,由地球物理所所劃危險區的 R 值,是遠高於由隨機亂劃所得的 R 值的。由此說明他們的地震預報不但愈來愈準確,而且是有真材實料的。
可惜,他們犯了一個很嚴重的錯誤,就是發生地震的機會並不是平均分佈的。譬如香港自有紀錄( 1905 年起)以來便從未發生過大地震。從上面幾個列表我們也可看見,中國的東、西部發生大地震的機率是很不同的。如果在模擬實驗中假設各地都可能有大地震,而實際上大地震只集中在斷層一帶,那樣,地球物理所所劃危險區的 R 值遠高於隨機亂劃的 R 值,又有何出奇?
由於 R = (n/AQ) - (AR-n)/(A-AQ),如果 AR、AQ 和 n 都不變的話,那麼 A 愈大,R 值也愈大。反之,如果並非全國 972 個網格都可能發生大地震的話,那麼以全國面積代入 A,只會令 R 值被嚴重高估。
要量度地球物理所的預報表現,可以這樣想。假設 AR、AQ 和 n 不變,但危險區的位置卻是隨機劃定的。那麼,命中少於 n 個網格的機會大不大?如果這個機率是很微小的話,那麼地球物理所能命中 n 個網格便不稀奇。這點陳學忠等人不是沒有想過,但他們的計算卻完全錯誤。由於這篇網誌的目的並不是談概率論,所以細節我就不說了。只要是讀過附加數的香港中學生,應該都可以看出陳等的論文中的技術錯誤。
長話短說,以下是在西部地區(AR、AQ 和 n 的數值見表 6)隨機劃定的危險區會命中少於 n 個網格的機會率,和實際有可能發生大地震的網格數目 A 之間的關係:
可以看到,地球物理所的預報算不算準,與 A 的數值有很大關係。上圖橫軸左端的數值(沒有在圖中標出)為 129 (約為 517 的四分之一)。如果在西部 517 個網格中實際只得四分一有機會發生大地震的話,那麼以 2004 年的數據來看,瞎猜較地球物理所的預測為差的機會率只有 0.245, 2001-2003 年就更不用提了。相反,若果西部 517 個網格都可能發生大地震的話,那麼地球物理所的預測差不多百分百是勝過盲猜的。由於陳等的論文缺乏西部 517 個網格完整的地震統計數據,要說地球物理所的預測準確,結論未免下得太快。
外國很多論文都以統計學來修飾或者誤導讀者,但中國的學者卻連中學程度的概率論也掌握不來。這兩種情況那個較佳,我不知道。
後記一:早上寫完本文後,傍晚看《鏗鏘集》,旁白竟然引用陳學忠等人的另一篇文章和早前在小博也提及過,由龍小霞等人所撰的文章,說早有學者預測過四川會發生大地震。這真是令人沮喪。我等平民百姓對地震學毫無認識,往往倚賴記者的報道。但當連記者都不盡力對新聞的內容求證時,普通人又如何決定究竟該信甚麼?
後記二:剛剛看《東南西北》網誌,看見一篇來自《新語絲》的文章,說耿慶國的旱震理論原來是偽科學!由於沒有第一手資料(耿的論文),我無法判斷網主所言是否屬實。但以網主提出的論據來看,其批評似乎有點道理。這不禁令我疑惑:到底中國的地震學界是不是都充斥著占星家?為甚麼近日在網上流傳的所謂「學術論文」,竟無一內地學者駁斥?!
3 則留言:
如果你有興趣相關的地理學研究的話,你問的問題後面涉及空間概率,空間依賴,和空間比較。空間預測和一般常見的統計概率比較有很大的分別,例如尺度依賴:你的方格劃得多大,對你的結果有決定影響。而地理學第一定律:「相近的地方通常相似」,也嚴重影響了一般統計學中對每個觀察都要獨立的要求。
對於如何把上述的考慮,應用在空間預測和空間結果的比較,近年的注意都放在地表改變的研究(如森林消失的預測)。我相信同一堆的數學模型,很可能可以應用在地震之上。不過這種研究只有七、八年的歷史,而且都困在研究院,全香港懂的人不會多過十個。
如果說這些在中國內地刊載的文章信不過,那麼在外國刊登的又如何﹖
前陣子National Geog就說,去年Tectonics出版了一篇論文,指北川地區將會發生大地震(只指出各種因素正在累積,沒有預測時間)。
我倒是奇怪為何《鏗鏘集》只會報道內地刊物的文章,而不去講講這一篇。
可能因為沒有預測時間,看起來不夠「型」吧。﹖
梁先生、方先生:
歡迎光臨。特別是方先生,竟然在上班時間「吞 pork」在小博留言,實在與有榮焉 ;-P
梁先生提及網格的大小對研究結果有決定性的影響,所言甚是。公平點說,陳學忠等人也有顧及這點,在論文中的模擬實驗,他們把整隨機危險區設為圓盤狀,並調節圓盤的半徑,看看會否有不同效果。但另一方面,他們並無說明由人手劃的危險區是否圓盤狀,更沒檢驗手劃危險區的 R 值是否對尺度異常敏感。所以感覺上他們一直只是在比較蘋果和橙(還要是作出很不公平的比較)。
「相近的地方通常相似」,回心一想雖然理所當然,但對我來講這確是個很新鮮的想法。謝謝指點。
梁先生說全香港懂得應用空間預測和空間比較的人不出十個,這是真的嗎?香港作為一個重商社會,如果有近十個這方面的地理學者的話,實在出人意表,可喜可賀。
《鏗鏘集》為甚麼不報道 Tectonics 那篇論文呢?同情地想,也許他們找不到方法下載吧。我現時在理大做短約工,發現圖書館的目錄雖然自稱可以進入 AGU 的 digital database,但進入首頁後還是要 password 才可下載。不知其他大學圖書館又如何。至於東南西北那條 link,起碼在打這個留言的時候是破的。要不是剛才上梁先生的 blog 看到另一條超連結,到此刻我還是只聞這文章的大名。
不過我心底裏倒是相信方先生所講的理由,這算是我們的小人之心吧。
平心而論,我覺得陳學忠等人這篇文章不算太離譜,只是研究方法太過粗疏(當然,梁先生作為專家可能有不同看法)。不過《鏗鏘集》援引的那兩篇文章——特別是龍小霞等人那篇——便確實太過份了。這兩篇文章根本不需要專門知識也能看出破碇嘛。這樣也擺在電視上講,不如找蘇民峰師傅來預測還有趣得多。
發佈留言