2009年11月26日星期四

六虎與牙牌籤

電鋸來郵問我曉不曉客家六虎牌。我這個生於斯長於斯的香港人,雖然於九七後無奈地覺得自己變了客家,可是卻不懂客家牌。本着好奇心,我翻書看看有無有關記載,誰知六虎牌翻不着,反而意外地解開了之前一個有關牙牌籤的謎團。

我以前提過牙牌籤的歌訣:
全副牙牌一字排,中間看有幾多開,
連排三次分明記,上下中平內取裁。
此歌訣最令人不解的地方,在於如何將排成一行的天九牌分組。原來有舊文獻曾解釋這點,詳見經過大幅修改後的《也談張愛玲的牙牌籤》。

2009年11月24日星期二

神牛棧道

近年很少看報紙,除了因為新聞可以從網上看之外,報紙的副刊愈來愈乏味也是一個原因。以人言報為例,以前它的副刊起碼有一半會令我感興趣,現在卻連找一篇有看頭的也難。

相比之下,網誌雖然都是看過就忘掉的多,但不時仍有令人驚喜的佳作。今個月我覺得很幸運,月頭找到這一篇,現在又有另一篇。像我等去書店也只會打書釘的 cheap 精,足不出戶就可以滿足閱讀的需要,真幸福。

2009年11月18日星期三

Re: constitutional reform

Dear Donald,

>>> Donald Tsang <http://www.news.gov.hk/en/category/administration/091118/html/091118en01004.htm> 18/11/2009 >>>

> We must take the Hong Kong people's aspirations to heart.

Agree. Please tell Beijing to do the same.

> This is time for all of us to focus on the overall interests and long-term development of Hong Kong.

Overall interests ... defined by whom?
You are being ambiguous here.

> This is a time for seeking consensus, not differences.

If you really want to convey consensus, why don't you organise a referendum (or a vote of preference, if that matters)? Constitutional reform is no ordinary subject. Twelve years have passed. We still don't see any sign of getting a genuine universal suffrage of Chief Executive (and Legco members). The people of Hong Kong deserve the right to express their preferences in this matter.

> This is a time to abandon impractical demands.

Why is universal suffrage of CE in 2012 impractical? Is it because
by then the apocalypse will arrive and we will be busy rushing into the arks built by People's Liberation Army but have no leisure time to play election games?

Please don't disguise the decision of the Standing Committee of NPC as an explanation. That Beijing doesn't like it is one thing, whether it is practical is another. As the chief executive of HK government, you should demand Beijing to explain why universal suffrage in 2012 is impractical.

> This is a time for rational and open discussions.

Asking for universal suffrage in the near term is not irrational. Banning it without any reason is. Just stop playing rhetoric and tell Beijing to become more rational.

> This is a time that we move forward.

The people of Hong Kong always try to do that. But Beijing prevents us from doing so. Now it is time for you to step forward and convince Beijing to move forward.

Best regards,
The suffocated

2009年11月17日星期二

膏鐵

《星島日報》報道
政府預計,廣深港高鐵在2016年通車後,客流量每日達9.9萬人次,預計營運收益達11多億元。

在立法會鐵路小組委員會上,民主黨的鄭家富質疑政府對廣深港高速鐵路的客流量估計過份樂觀,若乘客量不足,收益將不及政府原先的預測。運輸及房屋局局長鄭汝樺回應時表示,當局估計每日客流量達9.9萬人次,當中並未計算鐵路建成後,所衍生的旅客量,所以政府現時的預測已經是非常保守。鄭汝樺又指,高鐵的營運收益具可行性,毋須政府補貼,另外亦可以節省巿民的交通時間,帶來經濟效益。
網誌 scimonoce 對此有一番討論,我對這個題目沒甚麼見解,只想略為整理一下網主提到的數字。

想知政府及鐵路公司的估計有多「保守」,不妨參考當年籌劃西鐵的情況。下表是九鐵於 1998 年所估計西鐵線的每日平均乘客人次,與 2003-07 年間的真實數字:



不難發現九鐵的估計樂觀得離譜,以百分點計的話(見 Sheet2),2004 年的估計比實際數字高出一倍半(對,是高出一倍半,不是高出一半),即使是 07 年的數字,原先估計的仍比實際高出一倍。

有趣的是,如果看的是人數而非百分比,那麼由 04 年到 07 年,高估了的客流幾乎是個常數(廿一萬)。這究竟是巧合,還是九鐵的推算方法異常準確,但多算了某二十萬的基數,十分耐人尋味。

如果看乘客量增長率的話(見 Sheet3),九鐵的估計倒是比實際的低。scimonoce 的網主說 "actual growth rate was lower than expected",應是鬼揜眼之誤,可是這並非說九鐵的估計保守。從 04 到 07 年,西鐵的載客量不斷下降,如果西鐵要於 2016 年達至原先估計的每天五十八萬二千人次的客流量,那從 07 年起,載客量必須平均每年增加 11.93%。雖然今年八月西鐵線伸延至紅磡後,載客量應短暫增加,但 2011 年後增長率應回復萎縮,所以我們差不多可以肯定,到 2016 年,西鐵的載客量仍是遠低於當初估計。

其實,如果連新界西居民賴以通勤的西鐵,通車四、五年後仍不過每天廿一二萬人次,城際鐵路又那有可能一通車就有每天十萬人的客流?根據運輸署的資料[1],香港每天的陸路過境人數(包括本地人及旅客)亦不過三十萬人次,其中乘搭直通火車到其他城鎮(包括廣州)的,才不過八千人,我們又怎可能寄望高鐵接通廣州的山旮旯地區之後,一下子會跑出每日十萬個搭客?


[1] (連結)運輸署:「現時有兩條鐵路過境通道連接香港及內地,即羅湖及落馬洲支線過境通道。羅湖過境通道平均每日處理的旅客量約為236 200人次,而落馬洲支線過境通道平均每日處理約62 300人次(其中約33 500人次為鐵路乘客)。同時,每日亦約有8 000名旅客乘搭鐵路直通車往返九龍及內地多個城市。」

2009年11月10日星期二

大學奇譚之超級抄襲者

讀數、理或工科的研究生,可能聽過 SIAM (Society for Industrial and Applied Mathematics) 這個機構。SIAM 和 IEEE, ACM 一樣,它們旗下的期刊,都備受學界尊崇,就算不是頂級,質素亦必有相當水準。

上月 SIAM 刊登了一則罕見告示。事緣有人投訴,指一份期刊 International Journal of Statistics and Systems 所刊登的一篇文章,乃抄自 SIAM Journal on Optimization 去年某篇文章的預印稿。學界有抄襲醜聞,見怪不怪,但今次事件最特別的,是 SIAM 認真調查之下,竟發現抄襲者原來前科屢屢,單是半字不改地抄,斷到正一正的文章,就有五篇;內容相似的,SIAM 的行政總裁 James Crowley 只說他「知道其他幾篇由涉嫌由該兩名作者署名的文章,也可能有抄襲」,而沒有提數目,這也許表現了 SIAM 對追求嚴謹的堅持吧。

我最初看到這則消息,不期然想,「咦,會不會是偉大同胞?」(內地學界良莠不齊,我有以上想法,希望內地朋友莫怪。)不過兩位嫌疑人原來來自毗鄰內地的另一個文明古國 —— 印度。兩人原來屬同一間大學,一位是教師,一位是 M.Sc. 學生。Crowley 去信要求二人解釋,學生表示無論抄襲抑或在文章作者加上老師的名字,都是自作主張,老師並不知情。老師亦如是說。然而 Crowley 發現從該老師所屬學系的網頁所列出的研究論文清單,可找到上述五篇及其他幾篇涉嫌抄襲的文章,要說該老師不知道文章的存在,說不過去。於是 Crowley 再要求該名老師解釋,而後者則改口,說他知道有這幾篇文章,但因為不勞而獲,所以只覺欣喜,並無深究。他更說全系的同事都可以做證,自己研究的是代數學,完全不懂二人署名的幾篇文章所用的運籌學,抄襲一事,他確不知情。

此老師的說詞,信不信由你,但他們二人從此身敗名裂,似乎無可避免。當然,改過另一個名,又可以是一條好漢。

近年政府當局強行將學者的研究表現量化,逼他們出 paper,令不少學者都從內地請大批平靚正的槍手代寫,加上自己的名字。從某些學者的網頁,你甚至可以看到有平均一個月出超過一篇 paper 的超高表現。我唯有奉勸一句,小心舐嘢。

Link: Report on investigation of a case of plagiarism; SIAM

2009年11月9日星期一

統計學小筆記

連我等只念過初等統計學的人都知道,統計上的相關不等於因果 (correlation is not causation)。著名的小書 How to Lie with Statistics 就提過,根據南太平洋島國 New Hebrides 的數據,當地健康的土人身上往往有蝨子,病人卻無。然而若將此發現解為「蝨子令人健康」,卻是個大笑話。真正的解釋是病人發高熱,才令蝨子離開。

兩件事情統計上相關,可以是巧合,可以兩者有因果關係,也可能兩者無因果關係,卻有共同起因。嚴格來說,統計相關只可用來佐證研究者提出的因果原理,卻不可單憑本身來證明因果關係。雖然並非所有學者都如此視之(例如醫學研究者對甚麼時候可將相關視為因果,就有他們自己的一套),但「相關不等於因果」於大多數要運用統計學的學術範疇,已是金科玉律。

唯一公認的例外,是時間序列分析 (time series analysis)。若有 A 系列及 B 系列事件,A 系列的事件與 B 系列之中稍晚才發生的事件有顯著相關,那麼若兩者有因果關係,則必然是 A 為因、B 為果,原因是我們相信,將來不能影響過去。

當然,此兩系列的事件仍可能是巧合或者是某共同起因的結果,但人們已慣於將時間序列的相關視為因果關係的證據,而忘掉其他可能,不過現實中還是有令人訝異的巧合的。我剛剛在看一篇文章[1],發現原來從 1952 年到 1976 年七個美國總統選舉年,每次若由 American League 的隊伍贏得 World Series 棒球大賽,則必定是由共和黨候選人贏得選舉;反之,若由 National League 贏得比賽,則由民主黨人當總統。

[1] Helmut Norpoth, "Economics, Politics, and the Cycle of Presidential Popularity", Political Behavior, 6(3): 253-273, 1984.

2009年11月6日星期五