Alone in the Fart: 不懂地理也可試著理解地震論文

（前言：下文是我三天前開始寫的，但寫到一半便沒心情寫下去了。自問承受悲情的能力有限，尤其是在一次過看了幾十幅災區照片之後。今天總算有心機把文章寫完，不過關於地震的事，以後也許會少寫了。）

早陣子有很多關於地震預報的講法，網上亦流傳著有關的學術論文。一般人（包括我）不懂地震學，不知該信這些說法還是不信好。但正如五音不全的人亦能判斷歌手唱腔的好壞，有時只要夠耐性和細心，無須懂得高深的知識也能看出一些說法的不合理之處。

以下我會選一篇從《東南西北》看到的論文來解釋我的意思。雖然大家很關心地震預報的可能性，但為求方便，我揀的這篇文章並非關於如何預測地震，而是講如何評核地震預測的表現。其實宋以朗先生在他的網誌已經對此文作出了很恰當的批評，但我也不妨來個狗尾續貂，補充一下。

這篇文章的作者為陳學忠、陳佩燕及王林瑛，題為《對近年來地震危險區預測效果的評估》。每年初，中國地震局地球物理所都會列出一份有地震危險地區的名單。如果年內在這些「危險區」確有五級或以上的地震發生，那麼該項預測便算成功。當然，如果我把中國全境都劃為危險區的話，那麼這個預測幾乎必會命中，所以危險區劃得太大是沒意思的；可是劃得太小，又難以命中。要量度這些「危險區」定得好不好，需要有一個能夠量化的準則。

陳學忠等人就是嘗試用一個稱為「R值」的東西來做評核的標準。舉例來說，假設中國是一塊可以劃作 10 × 10 網格的土地：

如果我於年頭勾出了三塊長方形危險區（圖中綠色部份），而本年又在全國的八個網格（紅色部份）發生地震，那樣R值是這樣計算的：

設
A 為所考慮地區的總面積（以網格為單位，在本例中為 100），
A_R 為劃定危險區的總面積（綠色部份，在本例中為 31），
A_Q 為地震區的總面積（紅色網格，在本例中為 8），
n 為落在危險區中的地震網格數目（在綠色區域中的紅色格子，在本例中共 5 格）。
（註：在原文中，A, A_R 和 A_Q 的符號為 N, N¹ 跟 N₁，因太混亂，故改用現在的符號。）

那樣
R = (n/A_Q) - (A_R-n)/(A-A_Q)。

在本例中 R = (5/8) - (31-5)/(100-8) = 0.3424。當然，在現實中中國的領土及預估的危險區都不是長方形，但 R 的算法沒變。患有「恐數症」的朋友可能會咕嘀為甚麼 R 值的公式要如此設計，不過這裏我就不談了，只可以說，理論上，R 值最大為 1，而且 R 值愈高，代表危險區愈勾得準。地震局地球物理所把全國（不包括西藏地區）分成 972 個網格，其中西部地區佔了 517 個。以下是從 2001 至 2004 年，地震局地球物理所為全國及西部地區所劃的危險區的 R 值：

*表 5：2001—2004 年度地震危險區 R 值 (A=972)*
年度	A_R	A_Q	n	R
2001	111	16	6	0.265
2002	148	9	3	0.182
2003	84	16	6	0.293
2004	98	12	6	0.404

*表 6：2001—2004 年度西部地震危險區 R 值 (A=517)*
年度	A_R	A_Q	n	R
2001	78	16	6	0.231
2002	117	9	3	0.109
2003	63	15	6	0.286
2004	77	11	6	0.405

從這兩個表看來，這幾年的 R 值大致上在上升，似乎地震局的預報工作做得愈來愈好。

但真的是這樣嗎？

毋須精通地理或數學，只要夠細心，你便會發現以上的列表有個大問題。雖然上表好像給出了許多數據，但有時重要的不止是「看見甚麼」，還有「沒看見甚麼」。表 5 和表 6 列出了全國及西部的數據，但東部的呢？從這兩個表，其實可以推出東部的數字：

*2001—2004 年度東部地震危險區 R 值 (A=455)*
年度	A_R	A_Q	n	R
2001	33	0	0	N/A
2002	31	0	0	N/A
2003	21	1	0	-0.046
2004	21	1	0	-0.046

覺得怎樣？無論怎看也不算差吧。雖然每年關於東部的預測皆落空，但實際上頂多是沒有命中一次地震而已。可是 R 在此處卻是負數。這正正暴露了 R 值的缺點，就是我們不知應該用甚麼尺度來量度 R 值。就好像用五千萬元來賺一百萬，跟用五十萬來賺一百萬很不同這個道理一樣，R 值每升 0.1，並不代表同等的進步。在表 5 和表 6 中，雖然 2004 年的 R 值比其餘三年的為大，但它究竟是否已高到令人滿意的地步？此外，從 2002 到 2004 年 R 值的變化，到底是顯著的進步，還是很輕易便能達到的結果？

為了解答這些問題，陳等人假設地震在全國各個網格有均等的發生機會。然後，利用模擬實驗，他們發現在同等的地震數目 A_Q 和同等的危險區面積 A_R 下，由地球物理所所劃危險區的 R 值，是遠高於由隨機亂劃所得的 R 值的。由此說明他們的地震預報不但愈來愈準確，而且是有真材實料的。

可惜，他們犯了一個很嚴重的錯誤，就是發生地震的機會並不是平均分佈的。譬如香港自有紀錄（ 1905 年起）以來便從未發生過大地震。從上面幾個列表我們也可看見，中國的東、西部發生大地震的機率是很不同的。如果在模擬實驗中假設各地都可能有大地震，而實際上大地震只集中在斷層一帶，那樣，地球物理所所劃危險區的 R 值遠高於隨機亂劃的 R 值，又有何出奇？

由於 R = (n/A_Q) - (A_R-n)/(A-A_Q)，如果 A_R、A_Q 和 n 都不變的話，那麼 A 愈大，R 值也愈大。反之，如果並非全國 972 個網格都可能發生大地震的話，那麼以全國面積代入 A，只會令 R 值被嚴重高估。

要量度地球物理所的預報表現，可以這樣想。假設 A_R、A_Q 和 n 不變，但危險區的位置卻是隨機劃定的。那麼，命中少於 n 個網格的機會大不大？如果這個機率是很微小的話，那麼地球物理所能命中 n 個網格便不稀奇。這點陳學忠等人不是沒有想過，但他們的計算卻完全錯誤。由於這篇網誌的目的並不是談概率論，所以細節我就不說了。只要是讀過附加數的香港中學生，應該都可以看出陳等的論文中的技術錯誤。

長話短說，以下是在西部地區（A_R、A_Q 和 n 的數值見表 6）隨機劃定的危險區會命中少於 n 個網格的機會率，和實際有可能發生大地震的網格數目 A 之間的關係：

可以看到，地球物理所的預報算不算準，與 A 的數值有很大關係。上圖橫軸左端的數值（沒有在圖中標出）為 129 （約為 517 的四分之一）。如果在西部 517 個網格中實際只得四分一有機會發生大地震的話，那麼以 2004 年的數據來看，瞎猜較地球物理所的預測為差的機會率只有 0.245， 2001-2003 年就更不用提了。相反，若果西部 517 個網格都可能發生大地震的話，那麼地球物理所的預測差不多百分百是勝過盲猜的。由於陳等的論文缺乏西部 517 個網格完整的地震統計數據，要說地球物理所的預測準確，結論未免下得太快。

外國很多論文都以統計學來修飾或者誤導讀者，但中國的學者卻連中學程度的概率論也掌握不來。這兩種情況那個較佳，我不知道。

後記一：早上寫完本文後，傍晚看《鏗鏘集》，旁白竟然引用陳學忠等人的另一篇文章和早前在小博也提及過，由龍小霞等人所撰的文章，說早有學者預測過四川會發生大地震。這真是令人沮喪。我等平民百姓對地震學毫無認識，往往倚賴記者的報道。但當連記者都不盡力對新聞的內容求證時，普通人又如何決定究竟該信甚麼？

後記二：剛剛看《東南西北》網誌，看見一篇來自《新語絲》的文章，說耿慶國的旱震理論原來是偽科學！由於沒有第一手資料（耿的論文），我無法判斷網主所言是否屬實。但以網主提出的論據來看，其批評似乎有點道理。這不禁令我疑惑：到底中國的地震學界是不是都充斥著占星家？為甚麼近日在網上流傳的所謂「學術論文」，竟無一內地學者駁斥？！

3 則留言:

梁啟智說...: 如果你有興趣相關的地理學研究的話，你問的問題後面涉及空間概率，空間依賴，和空間比較。空間預測和一般常見的統計概率比較有很大的分別，例如尺度依賴：你的方格劃得多大，對你的結果有決定影響。而地理學第一定律：「相近的地方通常相似」，也嚴重影響了一般統計學中對每個觀察都要獨立的要求。

對於如何把上述的考慮，應用在空間預測和空間結果的比較，近年的注意都放在地表改變的研究（如森林消失的預測）。我相信同一堆的數學模型，很可能可以應用在地震之上。不過這種研究只有七、八年的歷史，而且都困在研究院，全香港懂的人不會多過十個。; 2008年5月26日下午1:47
方潤說...: 如果說這些在中國內地刊載的文章信不過，那麼在外國刊登的又如何﹖

前陣子National Geog就說，去年Tectonics出版了一篇論文，指北川地區將會發生大地震(只指出各種因素正在累積，沒有預測時間)。

我倒是奇怪為何《鏗鏘集》只會報道內地刊物的文章，而不去講講這一篇。
可能因為沒有預測時間，看起來不夠「型」吧。﹖; 2008年5月26日下午2:26
The suffocated 說...: 梁先生、方先生：

歡迎光臨。特別是方先生，竟然在上班時間「吞 pork」在小博留言，實在與有榮焉 ;-P

梁先生提及網格的大小對研究結果有決定性的影響，所言甚是。公平點說，陳學忠等人也有顧及這點，在論文中的模擬實驗，他們把整隨機危險區設為圓盤狀，並調節圓盤的半徑，看看會否有不同效果。但另一方面，他們並無說明由人手劃的危險區是否圓盤狀，更沒檢驗手劃危險區的 R 值是否對尺度異常敏感。所以感覺上他們一直只是在比較蘋果和橙（還要是作出很不公平的比較）。

「相近的地方通常相似」，回心一想雖然理所當然，但對我來講這確是個很新鮮的想法。謝謝指點。

梁先生說全香港懂得應用空間預測和空間比較的人不出十個，這是真的嗎？香港作為一個重商社會，如果有近十個這方面的地理學者的話，實在出人意表，可喜可賀。

《鏗鏘集》為甚麼不報道 Tectonics 那篇論文呢？同情地想，也許他們找不到方法下載吧。我現時在理大做短約工，發現圖書館的目錄雖然自稱可以進入 AGU 的 digital database，但進入首頁後還是要 password 才可下載。不知其他大學圖書館又如何。至於東南西北那條 link，起碼在打這個留言的時候是破的。要不是剛才上梁先生的 blog 看到另一條超連結，到此刻我還是只聞這文章的大名。

不過我心底裏倒是相信方先生所講的理由，這算是我們的小人之心吧。

平心而論，我覺得陳學忠等人這篇文章不算太離譜，只是研究方法太過粗疏（當然，梁先生作為專家可能有不同看法）。不過《鏗鏘集》援引的那兩篇文章——特別是龍小霞等人那篇——便確實太過份了。這兩篇文章根本不需要專門知識也能看出破碇嘛。這樣也擺在電視上講，不如找蘇民峰師傅來預測還有趣得多。; 2008年5月26日下午6:43

發佈留言

Alone in the Fart

2008年5月25日星期日

不懂地理也可試著理解地震論文

3 則留言:

Recently read

堆填區

語文工具書

Label