2011年12月30日星期五

身份認同的民意調查

……遭質疑的調查,發現只有一成七香港人自稱中國人,比率是十二年最低。發表一日後,郝鐵川找電視台記者茶聚,點名指民研計劃總監鍾庭耀提供的八個選項,實質和目的是將香港人和中國人並列,叫受訪者選一項,問題定得不科學和不合邏輯。因為回歸後承認自己是香港人,理所當然就承認是中國人,香港不是獨立政治實體,不是中國人,會是哪個國家的人。他建議鍾庭耀應該改問香港人現在是中國人還是英國人。

他指這是他個人意見,被問到是否認為民調有政治目的,是否應該停做,他拒絕評論。
先略過民意調查不提。中聯辦只是聯絡機構,近年卻愈發猖狂,不但不嚴守「一國兩制」之禁,對本地政務指指點點,還介入本地選舉活動,港人實在應該大力抗議。郝鐵川身為中聯辦職員,於公開場合發言,除非談私事,否則根本無「個人意見」可言,更何況今次他乃主動找記者茶聚。港大民意研究計劃並非官方機構,就算是,此民意調查亦屬香港內部事務,中聯辦無權插嘴。郝鐵川今次插口本地民間事務,本人雖只一介草民,亦不得不譴責。

回說遭郝鐵川批評的調查。這類有關身份認同的調查十分常見。鍾庭耀說此等調查非他獨創,香港廿年前已有其他學者在做。其實即使在外國,這類調查亦不罕見。例如蘇格蘭有英國人身份的調查,問人究竟覺得自己是「蘇格蘭人而非英國人」、「屬蘇格蘭人多於英國人」、「同是蘇格蘭人與英國人」、「屬英國人多於蘇格蘭人」還是「英國人而非蘇格蘭人」。加拿大魁北克省,亦有調查問人「只是加拿大人」、「先為加拿大人但也是魁北克人」、「同是加拿大人與魁北克人」,「先為魁北克人但也是加拿大人」還是「只是魁北克人」。大凡與所屬國有重大文化差異的地方,都常見這類調查。

即使是國與國之間,調查身份認同亦非奇事。例如俄羅斯有問卷問人是否認為烏克蘭人與白俄羅斯人都屬俄羅斯民族(見此),歐盟有問卷問人認為自己只是某國的人、同是某國人與歐洲人,還是只是歐洲人(見此,p.97)等等。調查所問,並非別人如何界定自己的身份,而是自己從情感上如何界定自己身份。正常人看到這類問卷,都不會誤會問題的意思。郝鐵川說「承認自己是香港人,理所當然就承認是中國人」,要不是他的理解能力有問題,就是他只顧揮舞當權者旗幟去界定港人身份,或者兩者皆然。

2011年12月29日星期四

萬曆與金正日

黃仁宇著,萬曆十五年,增訂二版,食貨出版社,臺北,一九九九年,頁一一七:
在他(萬曆)的母親慈聖太后去世以後,禮部立即鄭重制定了喪儀,宣布全國居喪二十七日,臣民全部服喪,帽子上纏以白布。全部京官一律披蔴帶考,不許穿著朝靴而代之以草鞋,摘去紗帽的兩翅而代之以兩條下垂至肩的白布。大小寺院鳴鐘三萬響,晝夜不息。三日之內,四品以上的官員及其夫人分批整隊前去慈寧宮舉行禮儀上的號哭,號哭十五次,全部人員的動作協調,一哭皆哭,一止皆止,有如交響曲。

2011年12月22日星期四

2011年12月21日星期三

The joy of learning

呢個標題,是抄自電鋸的。史丹福今季的 AI 與 ML 課程剛剛完結,距離下一季開課還有一個月,於是我昨晚急急腳上網報讀同樣剛剛完結DB 課程。雖然任何人事後都可以上網睇返 lectures 的影片,但係無報讀的話,就無得觀看功課內容,更遑論做功課或參加考試。

據說 DB 乃三個課程之中,難度最接近正式的本科生課程者。我一口氣完成了第一週的課程,覺得 DB 在三個課程當中,真係「有 D 嘢」,不但老師教得最好,功課亦設計得最佳,令我每條題目都學到嘢。我無諗過自己學 DB 呢類睇落好 Q 悶的課題,結果反而最留心聽。例如以前好多次試過想學 XML,但係拿起書讀幾頁就已經見周公,但係睇史丹福的 lectures,做了幾題寫 DTD 的 hands-on exercises,就即刻入腦。第四份功課講 Relational Algebra,最後一題好難,但係又唔會令人氣餒。最後解決到的時候,真係好有滿足感,玩得好過癮。下一課係 SQL,期待更有趣的挑戰。

2011年12月17日星期六

保嬰鎮驚丸

讀舊書舊報,常常有一種時間混淆的感覺。上圖看似舊香港六七十年代產物,就算再推前一點,亦頂多令人想起民初中國,但它其實載於 1816 年(嘉慶廿一年)出版的 Researches into the history of playing cards (p.81)。我完全沒想過當時有這麼「現代」的廣告/說明書呢!

2011年12月15日星期四

2011年12月12日星期一

忘不了(一)

阿濕

這裏是香料埠市內一間廿四小時營業的快餐店。午夜時分,店內的立體電視,正傳來陣陣歌聲。

「如何喜歡你~~如何結識你~~我似是一一的淡忘,唯獨情深一片……」

「嘩~咁都得?」「好惡頂!好心佢收皮啦!」阿濕鄰桌兩名艷抹濃妝的少女在訕笑。

確實,揪局長五音不全,比一般人還糟糕。若是友儕之間玩虛擬演唱會也罷,但他偏偏要在立體電視獻唱。根據香料埠「關愛弱勢社群法」,凡是政府指定的立體電視慈善籌款節目,所有電視台均須直播,並於當晚不停重播。除非因不可抗力、醫療理由,或者能夠證明自己正在執勤,否則每位市民必須於節目播出時,用身份認證手鐲,從網上確認自己觀看該節目最少半小時,以示齊心關愛。大部份市民都覺得此舉完全與時代脫節,但既然無人提出更有效的籌款辦法,而且一年之中,也只有春節晚會、國慶文藝晚會與兩次籌款節目是強制轉播,所以節目仍是一年一年辦下去。

「姑勿論歌藝,揪局長算是台型不錯,也唱得很投入呢。」阿濕一邊攪動奶茶,一邊心想。比起原唱的卵伯,揪一鑊的歌喉反而令阿濕沒那麼反感。察覺到這一點的阿濕,不禁搖一搖頭,訝異自己竟然有這樣的心態。

卵伯。香料埠的樂壇史上,能稱得上是天皇巨星的,屈指可數。平情而論,卵伯的歌藝雖然不差,但比起同輩或後來的其他歌手,也談不上是頂尖級別,不過歌唱本來就是表演事業,除了歌藝,還有外貌、台風、曲、詞、編曲、宣傳、形象設計等等多方配合,再加上人緣和運氣,方可塑造出天皇巨星,而卵伯年輕時,就正好有齊所有有利條件,所以客觀來說,他無疑配得上他所得的地位。

曾幾何時,阿濕也是卵伯的忠實歌迷,直到十四年前,強瓷國取代小米國,成為香料埠的殖民地宗主之後,他對卵伯的觀感才有一百八十度的轉變。事源有一次,電視台舉辦某個晚會節目,卵伯上台談及自己最尊敬的人時,竟然奴顏婢膝地利用光劍 (lightsaber) 揮出新總督的名字,完全恬不知恥。更難看的,是他竟然連總督的名字也搞錯,將「佟政華」弄成「痛症華」,其醜態頓成民間笑柄,不過佟政華後來又真的自稱患上痛症而請辭總督之職,卵伯也算是一語成讖了。

之前那杯奶茶已見底,阿濕到櫃面買了另一杯。回到座位,他想,比起殖民統治者,自己更厭惡奉承權貴者一事,是否表示自己其實也是折服於強權之下?阿濕想不通。若是卵伯的話,大概沒有這樣的煩惱吧。

卵伯
昏暗的客廳中,卵伯望著立體電視上不知重播了幾多回的籌款節目,覺得有些懊惱。

「電視台沒有邀請我和局長合唱,難道我以後,就只能於電視上替慈善機構推銷愛心購物券?」

卵伯想起圈中其他人。收視最高那個電視台的當家花旦,已經是強瓷國的國會議員了。那位飾演驅魔人成名的甘草演員,也曾當上本地政團「紫荊專制同盟」(Bauhinia Alliance for Despotism in Spice Port, BAD) 的鎮議會議員。眾所周知,同盟其實從屬於強瓷國執政同生黨,其高層成員,不少都是同生黨的地下黨員,只不過強瓷國為了維持殖民地表面上的自治,才不公開它與同盟的政治聯繫。

「就連那個所謂『香料埠搖滾之父』,同盟都對他青眼有加了,為何總不輪到我? 」想到這裏,卵伯恨得有點牙癢癢。

卵伯並非那種亟亟追求權力的人,他其實和這個拜金城市許多其他人一樣,都只是追求財富。香料埠娛樂圈一向流行一種說法,指藝人不懂做生意,諷刺的是,大部份藝人都偏偏喜歡拿自己的積蓄來經商,卵伯也是其中之一。當香料埠還是由小米國統治的時候,卵伯已經夥同幾位圈中好友做生意,包括城中著名食肆「日日香料」。那時,香料埠的黃金年代其實已經過去,整體社會流動性下降,貧富懸殊加劇,表面的經濟發展,實際是資產泡沫膨脹的結果,不過遠在泡沫爆破之前,「日日香料」已經結業,這只能說是卵伯他們經營不善。

香料埠併入強瓷國後,卵伯與好友重操故業,以「日日香料」的招牌,於強瓷國內開了幾家店子,生意還不錯,不過經過大起大落,卵伯已經有點怕了,希望有多些保障。於強瓷國做生意,打好政治關係是很重要的。累積多些政治資本,即使是本地的,對廣結人脈也是好事,而且卵伯也想多些於電視露面。雖然已屬過氣歌星,但明星效應始終有助維持店子人氣。

可是,無論卵伯怎麼努力,仍是沾不上政治的邊。 新殖民政府成立後,本地人靠文過飾非討好帝國的人比比皆是。例如廿多年前強瓷國大舉屠殺示威者,史稱「血腥星期日」,當年本地政客就一致譴責。然而,殖民地改宗之後,不少人就紛紛改口,叫大家放下「歷史包袱」,說當年的「風波」是帝國通向繁榮之路所必須付出的犧牲云云。可是這些政客並無深刻「反省」自己當年的言論。相比之下,以前卵伯用首本名曲諷刺強瓷國的暴行「你知我知」,最近卻反而於光子信息網「天空水滴」中發信息說,支持民主主議的某些議員之反動,實屬「你知我知,阿媽都知」。儘管後來由於害怕遭網民圍剿而刪除信息,但照道理,帝國在香料埠的代理人,應該明白我比其他人更努力改變才對。為何自己的努力總是不受重視?卵伯不明白。

卵伯嘆了一口氣。算了,暫時別再想吧。話說回來,揪局長雖然唱得不濟,但頗為投入。卵伯心忖,難道揪一鑊有甚麼感觸?(未完,待續或爛尾)



作者聲明:本故事純屬虛構,如有雷同,實屬不幸。

2011年12月1日星期四

功夫

1:27 與 2:27 兩節都很不錯。

2011年11月30日星期三

有志成為 Jack the Ripper 者請報讀

不得不打倒昨日的我了。史丹福大學醫學院竟然也開設網上課程,教授解剖學,更完全毋須預備知識。(當然,無得實習!)哇~哈哈哈哈,我已感到自己邪惡的血脈在沸騰!

2011年11月29日星期二

眨眼又一年

真係要善用時間。



我素來都唔鍾意細路仔學大人唱情情塌塌的歌,總覺得好似上「殘酷一叮」標奇立異。人情咁複雜,細路唔使咁急失去童真嘛。下面呢段片,結尾時女孩箇一笑雖然造作,但總勝過扮晒投入感情,算係挽回成條片的格調。

2011年11月23日星期三

拼命拚命拌命判命

一個人嘅出生呢,係無得揀嘅,但係呢……一個人佢決定嘅革命路線,係有得揀嘅。
 ── 廿一世紀香港資產階級革命家唐英年同本文唔啦更嘅語錄[*]

古人有避諱之舉,但我今日看古德明的專欄文章《成語的墮落》,方知原來在所謂「新中國」,辭書編者為了避免冒犯國家領導人,亦要指鹿為馬,收入偉大舵手誤寫而成的「前赴後繼」,正確寫法「前仆後繼」反而從辭書消失,嗚乎。

古德明又提到華國鋒曾將「拚命」誤寫成「拼命」,而後來內地的文字改革委員會,亦以「拼」代「拚」。「拚命」一詞,本網誌以前也提過。香港俗諺「pun2 死無大害」,其中的 pun2 就是「拚」(粵拼 pun3)白讀時的變音。平時有些人說「拼命三郎」,其實亦搞錯了《水滸傳》中「拚命三郎」石秀的綽號。

「拚命」雖為正寫,「拚」字卻非本字。「拚」這個單字有多重意義,而作捨棄解,查實係「拌」的俗字,詳見台灣《教育部異體字字典》。漢.揚雄《方言.卷十》:「拌,棄也。楚凡揮棄物謂之拌」。「拌命」一詞,可見於宋.黎靖德《朱子語類.卷一一六》:「拌命進前, 有死無二, 方有箇生路」。

然而清代《經典文字辨證書》又認為「拌」是「判」的俗寫。「判命」一詞,亦見於古籍,宋.王稱《東都事略.章惇傳》就提到蘇軾說章惇「能自判命者,能殺人也。」由於《東都事略》、《朱子語類》與《水滸傳》三本書的成書時間,前後相差不過一百年左右,也許「拚命」這個俗寫,差不多從一開始就變得普及。

附註 [*]:語錄中「出生」一語,係唐先行者說的。正確的字眼應該是「出身」(「身」字無鼻音)。日後辭書會否因將就唐語錄而改「出身」為「出生」,如同傳媒為了曾特首而改「感同身受」為「身同感受」,各位不妨放長雙眼看。

2011年11月21日星期一

Windows XP 的 Octave 繪圖視窗問題

若果讀者如我一樣,於 Windows XP 上裝 Octave 而發現它的繪圖視窗有不正常表現,那可能是一個稱為 oct2mat 的 package 在作怪。解決辦法,請參考以下網頁:
我沒時間逐個方法試,所以一口氣將它們全部用上。現在問題似已解決。簡單來說:
  1. 運行 Octave,於 Octave prompt 輸入 pkg rebuild -noauto oct2mat 指令,然後關閉 Octave。此指令會卸除與 gnuplot 有衝突的 octmat 套件。若用家日後有需要,可於 Octave prompt 打入指令 pkg load oct2mat 重新安裝。
  2. 於安裝 Octave 的檔案夾內尋找名為 ginput.m 的文件,將它改為其他名字,例如 ginput.xx.m 或 ginput.m.bak 之類。網頁說新版的 Octave 其實已有 ginput 的功能,故此用不著此文件,不過穩陣起見,改名勝於刪除檔案。
  3. 另外尋找一份名為 __gnuplot_ginput__.m 的文件,於第 112 行,亦即 while (isempty (str)) 迴圈開始以後,加入 sleep(0.05); 一句(留意結尾的 semicolon)。
  4. 又,尋找一份名為 __plt__.m 的文件,於 function 結束之前,亦即最後一行的 endfunction 敘述之前,加入 pause(0.05); 一句。

2011年11月17日星期四

史丹福 2012 年春季公開課程

Stanford U. 的工程學院於來季會開設多項免費、公開但無學分的網上課程,而該校其他學院與另外一些大學院校亦紛紛響應,例如 UC Berkeley 就開設下述的 SaaS 課程。比起 Stanford 今季只開三科,來季起碼合共有七個九個超過十個不同科目,執筆時數目仍在增加,不能盡錄。有興趣的朋友不妨報名。

身為過來人,奉勸各位,無論課程有多吸引,最好還是只讀一科,否則時間實在太吃緊(我今季報讀了兩科,而且課程中近半都是我原本就懂得的東西,但仍是感到「困身」和吃力),但各位可以先報多個課程,然後才決定主攻那一科,而放棄其餘。
後記:我報讀了 SaaS 及 NLP,開學後看情形才決定是否放棄其中一科。NLP(是 natural language processing,不是那種騙錢的 NLP)是我一直想知的範疇。SAAS 則不然 ── 事實上我覺得自己「未夠班」去學 ── 但它的課程看來十分實用,又似有 hands on 的 programming exercises,所以一試。教授們的英語也是我考慮報讀的原因。看兩個課程的簡介短片,四位教授的英語都非常清晰,100% 聽得懂,比起今季 AI class 兩位教授,實在好太多了。

Word play


這個噱頭着實有趣,給商戶利用一次也無妨。

2011年11月11日星期五

馬弔、馬吊與 search engine optimization

記得以前坊間有不少書籍教人做 search engine optimization,但基本上都是英文著作,而近來我就遇上一個意想不到,關乎傳統中文與簡體字的搜尋排名優化問題。

事情是這樣的。個半月前,我的「重構明代馬弔牌例」系列文章完稿,心情難免有點興奮,覺得若要於網上搜尋馬弔牌規,拙文即使不在第一位,也應該出現於搜尋結果的首頁吧。

然而事實出乎意料。若搜尋「馬弔」 ,無論是 Google, Yahoo 抑或 Bing,我的文章的確現於首頁,但是搜尋「馬吊」的話,就連影子都無。有趣的是,尋找「馬弔」 ,三個搜尋器都會顯現含有「馬吊」一詞的網頁,但反過來則不然。由於「吊」也是「弔」的簡體字,可能各搜尋器均對關鍵詞有「繁→簡」轉換,卻不會反過來利用「簡→繁」變換來擴大搜尋範圍。

可是「馬吊」只是近人寫法,古籍中,此牌戲的名字幾乎一律是稱為「馬弔」的呀!難道為了推高搜尋排名,就要改「弔」為「吊」?總覺得很難妥協。最後,我嘗試於系列的每篇文章中都加入
(關鍵詞:馬弔、馬吊、打馬吊、馬吊牌)
一句。個半月以來,若搜尋「打馬吊」,拙文排名在 Google search 之中正穩步上升,從二十頁開外上升到執筆時的第十頁,總算有少許成效。然而,若搜尋「馬吊」或「馬吊牌」,拙文依然未見影。

這是個很好的教訓。若讀者想提高你們的網頁排名,某些關鍵詞,還是採用通用(儘管未必正確)的寫法為妙。

2011年11月9日星期三

披一身星塵


許冠英(1946-2011)

兩天前,北風近,漆黑臨。
不虞又聞噩耗。願逝者安息。

香港人真重視學術

今屆區議會選舉剛剛落幕,選舉管理委員會主席馮驊表示,政府今年接獲十宗以個人或團體名義提出的票站調查申請,全部聲稱目的為「學術研究」。他說:
如果有機構申請在某一個選區之內的票站進行票站調查,而這個選區裏面有候選人和這些機構有密切聯繫的話,那麼原則上我們是不會批准這類申請的。
結果十宗申請之中,政府只拒絕了其中一宗。我倒有興趣知道申請人是誰,以及申請遭拒的原因。

只要打正旗號,我不介意政黨利用票站調查結果來調整選舉策略。然而現在這些票站調查機構,有多少是由親北京的第三者資助的選舉機器,打着學術研究的幌子,從選民口中輕易騙取情報,又不用申報開支,大家心知肚明。可惜,除非有線人告密,否則要捉賊拿贓,絕不容易。

今年獲准作票站調查者如下(亦見有線新聞):
  • 香港研究協會(梁振英及范徐麗泰為協會顧問,理事會主席為新一代文化協會總幹事蘇祉祺,曾任中央政策組非全職顧問;今年於 206 個選區作調查)
  • 香港社區研究中心(負責人為新界社團聯會元朗地區委員會成員胡春月;157 區)
  • 香港社會監察(負責人為民建聯黃大仙統籌主任鄧秀玲)
  • 港大民意研究計劃(19 區)
  • 民意咨詢中心有限公司(15 區)
  • 南區民生促進會(8 區)
  • 盧曼思(週刊記者;3 區)
  • 嘉智學校(1 區)
  • 某人(1 區)
「港大民意研究計劃」的鍾庭耀提及 2004 年立法會選舉時,曾說:
筆者根據選管會網頁上的資料,再核對兩支香港大學研究隊的內部資料,整理出一個人力資源數表。由於選管會的資料有不少重疊之處,筆者只能盡量精確。數表顯示,七支研究隊中,公共事務研究學會最人強馬壯,其次是香港社會及經濟研究所,再其次是香港青年協進會,合共派出接近二千人在超過三百個票站進行調查。再細察三大機構所選的票站,區域分明,就算其中兩個機構在九龍東同時出現,選址亦無一重疊。筆者沒有考究該等機構的背景,但所動用的資源,的確令人咋舌。
事隔七年,情況似無多少改變。以香港島為例,今屆區議會選舉,撇除有人自動當選的選區之後,共有 60 個有競爭的選區,而獲准在當中進行票站調查的團體有四個:
  • 香港研究協會(44 區)
  • 民意咨詢中心有限公司(11 區) 
  • 港大民意研究計劃(4 區)
  • 南區民生促進會(8 區) 
各機構當初申請調查的選區重疊如下:
A04 山頂:香港研究協會、港大民意研究計劃
A07 觀龍:香港研究協會、港大民意研究計劃
B05 大坑:香港研究協會、民意咨詢中心有限公司、港大民意研究計劃
C34 樂康:香港研究協會、民意咨詢中心有限公司
D05 利東:香港研究協會、南區民生促進會
D06 海怡東:香港研究協會、南區民生促進會
D07 海怡西:香港研究協會、港大民意研究計劃、南區民生促進會
D08 華貴:香港研究協會、南區民生促進會
D09 華富一:香港研究協會、南區民生促進會
D10 華富二:香港研究協會、南區民生促進會
D14 石漁:民意咨詢中心有限公司、南區民生促進會
D15 黃竹坑:民意咨詢中心有限公司、南區民生促進會
D16 海灣:香港研究協會、民意咨詢中心有限公司
其中, 香港研究協會與民意咨詢中心有限公司,出奇地只有三區重疊。若兩個機構皆隨機選擇要調查的選區的話,重疊不過三區的機會率,只有

$$
\left.\sum_{i=0}^3\binom{44}{i}\binom{60-44}{11-i}\right/\binom{60}{11} = 0.00053.
$$
平均要 $1/0.00053 \approx 1887$ 次選舉,才會遇到一次這樣的情況,而自九七年起,現在才是第四屆而已,真令我想買六合彩。

考究兩個機構的調查員名單的話,結果更有趣。為了預防意外,令運作上更有彈性,調查機構一般在提交調查員名單時,每區所填的人數都會多於實際需要,因此同一個調查員的名字,會出現在不同選區的調查員名單之中。例如香港研究協會提交的太古城東 (C0201) 及鯉景灣 (C0301) 調查員名單分別為:
  • 陳皓泓、李芷欣、黎芷欣、李志恆、梁詠欣、馬傑絲、陳樂融、黃翠霞、鄧志豪、穆家駿、吳雪蓮、李振禹。
  • 王珊、陳信宇、劉美岐、王梓瀠、嚴朗而、陸正喬、陳樂融、黃翠霞、鄧志豪、穆家駿、吳雪蓮、李振禹。
以上兩份名單有六個名字重覆。香港研究協會有些調查員,甚至出現於十三份名單之多。這種於名單上填上「預備隊」的做法很平常。例如港大民調,人手並不充裕,因此它所提交的每份名單,皆填上同樣的二十人,以便臨場調配人手。於最極端的情況,港大的隊伍甚至可以放棄某些選區,將人手全投入其他地方(實際上他們於選前一日決定全港只調查十區,而非原定的十九區;於香港島則放棄調查 D07 海怡西)。若事先提交的各名單上沒有重覆的人名,就不能隨機應變了。

基本上,「香港研究協會」與「民意咨詢中心有限公司」的每份調查員名單,皆由某數目的固定人手(人名只出現於該名單)加上另外某數目的預留兵力(名字出現於多份名單之上)所組成,只有三區例外,而這三區,就正正是兩個機構重疊調查的選區(即 B05 大坑、C34 樂康與 D16 海灣)。當中,香港研究協會的做法無變,但是民意咨詢中心有限公司唯有在這三區中,它的調查員方全是預備隊。

當然,兩個機構合作,互相告知對方的部署,是學術研究常見的事,我是不會勸讀者想太多的。若要從陰謀角度去看,總可以找到切入點。例如香港研究協會的調查員,許多都是公開招募回來的學生,若要雞蛋裏挑骨頭,我們可以問,為何好像有許多「左派學校」的學生當調查員?香港研究協會的百多位東區的調查員當中,起碼有一半的名字與培僑中學、福建中學及漢華中學的學生相同,甚至有培僑中學老師(李振禹)的名字。這是巧合嗎?這班中學生是否跟其他調查員一樣受薪?他們是出於自願還是不願拂逆老師,才被迫或被誘導當義工?

現今本地大學不斷削減預算,學者申請做一個一年二十萬的細 project 也不容易。香港研究協會這項「學術研究」,光是支付港島區 366 位調查員的工資,一天之內已經花去 \$146400,更遑論支付所有調查員及研究人員的開支了。連港大鍾庭耀這塊金漆招牌,也只能湊得七十多名義工,那些民間學術機構的金主,還真是重視學術呀!

2011年10月28日星期五

書釘偶拾:Donald Hill 的香港淪陷日記

1940 年,日本侵華如火如荼,香港亦岌岌可危。時任英國總參謀長的伊士美男爵,認為香港易攻難守,建議撤防。香港總督羅富國爵士認同伊士美的想法,於是去信國會,敦請英國完全棄守,以免將來戰事發生,牽連平民傷亡、城市損毀。

英國的政、軍各方對於應否棄守香港,想法分歧。有些人認為日本根本不會對英、美宣戰;有人認為香港可守;亦有人(例如邱吉爾首相)認為香港難守,但出於政治考慮,不可撤防。最後,如我們所知,英國決定增兵香港,而從加拿大調來的兩營官兵,抵港未夠一個月,就成為大英帝國可憐的棄卒。然而,當時防衛香港的主力,無可否認仍是帝國本土將兵,香港政府官僚亦克盡己任。輔政司詹遜,更是不幸地於戰前一日才來港履新。香港重光後,當受盡監獄折磨的他離港時,仍不忘於電台廣播表示香港應實行政治改革。

今日舊主去,新主來,行新式殖民統治。政府不再紀念香港重光日 (Liberation Day),大概是新的殖民統治者認為,他們才是「解放」香港吧。維基百科上比較中性的「香港主權移交」條目,也給改名成「香港回歸」了。有一個半世紀歷史的香港「回歸」到當時五十歲還未夠的「新中國」,真是奇聞。早幾天中共《國際先驅導報》甚至說「新中國重返聯合國40年」,大概在新的國家,人民也要說「新語」 (Newspeak) 吧。

回說第一次香港淪陷。這段歷史,今日書本紀錄甚詳,但多是參考或整理官方文獻而成,官兵的親身經歷,反而少有記載。戰時由駐港皇家空軍的七校尉之一的 Donald Hill 所寫的密碼日記,就彌足珍貴(喜歡密碼學或數學的讀者,更會喜歡英國 Surrey 大學數學系高級講師 P.J. Aston 所述,如何破解 Hill 密碼日記的故事)。這部日記用密碼紀錄了 Hill 從 1941 年 12 月 7 日到該月尾的經歷,九六年獲破解,重見天日時,本地報章亦有報道,現在重讀,仍覺得值得推薦,例如我們知道日軍來襲時,皇家空軍連一架飛機也起飛不了,但原來就算它們能起飛也沒大用途,原因是它們五架都是輕型轟炸機,沒有戰鬥機,而且它們還要是落後的雙翼機種!

破解後的日記全文,仍載於 Dr Aston 的網址,以下摘譯頭兩日所記。



7/12/41,星期日。人人都談論對日戰爭,但似乎無人認為會有事發生。我們在港的皇家空軍只是很小的一羣人,有七名軍官、六十位士官與五架飛機,包括兩架海象與三架角馬[1]。何利上校乘運兵船尤里西斯號往星加坡,留下蘇利雲中校做司令。我勉強有幸指揮我們唯一一個小隊,和獲得三名軍官加入:格雷中尉,暱稱多利,也是信號員;波格中尉,或稱溫比,是設備員;克羅斯利少尉,暱稱  Junior,紐西蘭人,剛從星加坡來,沒多少飛行經驗。我們的副官是「上校」湯臣中尉,他是義勇軍,六月才從星加坡來到啓德。最後還有軒尼詩中尉,澳洲人,剛從星加坡過來成立作戰指揮室。笑話是,為迎接新戰機,經已萬事俱備,但未來一個月也難望有新機的影子。就憑五架舊飛機與一個機場,前景並不似錦,看來,若戰爭殺到香港,我們最終會被編入陸軍。今天收到的消息愈來愈差,人人留守軍營,做足預防措施。我駕駛一架滿載炸彈的角馬做爬升測試,其間想像那裏才是最佳投彈地點,遇到敵方戰機又有甚麼法子。然而到處都那麼平靜,遠在下方的香港又這麼美麗。我們將海象泊在水上,又分散角馬,但你看,它們變成多麼吸引的目標。皇家蘇格蘭第二營與煞帝利旁遮普兩營已於新界就位,港島正由加拿大兩營新兵防守,而才不過剛剛抵達的中撒克斯營就防守海岸線。最後還有歐洲人、華人、葡人等等的義勇軍四千人。我們的海軍只有一艘驅逐艦,十艘魚雷艇和一些炮艇。兵力毫不強大,尤其是我們完全切斷了外間援助,彈藥只夠用一百日。可是每人看來依然心情開朗。我是值班人員,躊躇是否該睡一下。

8 日,星期一。我大清早就被人叫醒,原因是輔政司來電,說和日本的戰事一觸即發。該死,不能睡了,於是我叫醒其他軍官。吃早餐時,我們獲悉我方正和日本開戰。我們衝下樓到機隊處,剛好聽到不祥的飛機轟鳴,超過三十架戰機護送着九架轟炸機,正朝我們飛來。除了派人到防守崗位之外,已無暇做其他事情了。轟炸機從頭上經過,但戰鬥機就撲向我們,朝我們的飛機洒下濃密的彈幕。我們用盡我們微薄的力量來對付他們。有些印度兵發慌衝進掩體,由於太過亢奮,不停開機關槍。一陣瘋狂求生,神奇地無人中槍。廿分鐘戰機密集攻擊過後,已上彈那架角馬湧出黑煙,兩架海象亦浴火下沉。最後他們匆匆離去 ── 希望並非完璧吧 ── 而我們亦檢查損失。兩架海象都沒了,一架角馬在燃燒,另一架嚴重損壞,只剩一架無事。我們試着滅火,祈願炸彈不要爆炸。火勢太猛了,角馬燒乾燒淨,遺骸中只有兩顆燒得通紅的大炸彈。只餘一架飛機,但沒有人員傷亡。有八架民航機完全燒毀,包括美國的「飛剪號」(Clipper)。到下午,轟炸機又回來轟炸船塢與九龍,有一根棒落在機場上。據報前線有激烈戰鬥,說日本仔用一個師攻擊,另一師作預留兵力。

譯註:
[1] 兩種都是雙翼輕型轟炸機。

2011年10月19日星期三

SEE

前文提到史丹福大學設立了三個免費、公開但無學分的網上課程,其實它還有其他課程,雖不公開報讀,但課程的材料是公開的,例如有一科 iPhone Application Development,有志開發 iPhone Apps 的朋友不妨一看。校方稱它的公開課程計劃為 Stanford Engineering Everywhere (SEE),目的是為了與 MIT OpenCourseware 競爭。

AI and ML

無心寫文章,吹吹其他水。

月前於《小城科學》blog 及電鋸處看到史丹福大學開了 database, artificial intelligencemachine learning 三科免費、公開但無學分的網上課程,儘管我全部都有興趣,但是 database 方面,總覺得若無實際問題在手,齋聽書還是讀不通;況且現今資料庫的應用,十居八九都與網絡有關,可是自己對網絡一竅不通,所以還是作罷。其餘兩科,本來只報其一,時間上比較鬆動,但心癢之下,還是兩科都報讀了。

根據校方數字,最後每科都有幾萬人報讀。面向如此大的群體,又除了聲譽之外沒有實利,課程自然較本科生所念的淺,許多材料會被 heavily dumbed down。例如看 AI 課的學生論壇,AI 的本科課程 CS221 於頭兩週過後,就要學生用課堂中所教的 A* search 做一個 project,寫一個類似用於 Pac-Man 遊戲的算則。參加 AI 網上網程的學生,不但毋須做 project,功課也大多只是網上選擇題,難度低很多。(後記:出乎意料,原來 AI 課的功課與考試與給予正規學生的相同,但 ML 的網上功課就和正規生的有別。)

AI 第一週所教的,大多與其他大學課程有重疊,例如用 BFS, DFS 搜索樹形圖等等,這些也是運籌學 (Operational Research) 的標準內容,不過學習一下 CS 佬的觀點也不是壞事。然而,不知是教授本身還是 CS 佬的慣例,課堂中好些語彙的用法,似乎都大大偏離學界常規。例如科學上,當我們說 discrete problem 與 continuous problem 的時候,discrete 的可以是 finite,也可以是 countably infinite,總之就是 countable。只有有 uncountably infinitely many states 的問題,才稱為 continuous problem。可是根據教授的說法,discrete problem 就是有 finitely many states 的問題,其餘的一律稱為 continuous problems。路徑的長度是另一個例子。教授稱 BFS 為 shortest first search,他又說 BFS 與 uniform cost search 都能夠找出 optimal path。然而 uniform cost search 尋求的,是最低代價 (cost) 的路徑,而 BFS 所得到的,只是一條最少節點的路徑,而完全不理會路徑的代價。要說 BFS 保證找到 optimal path 也可以,只不過這個 "optimal",指的是節點或層級的數目,而非路徑的代價。在其他學科中,例如圖論或運籌學,arc cost 歸 arc cost,no. of arcs 歸 no. of arcs,兩者決不輕易混為一談。

教授於 lectures, quizzes 跟 homework 的遣詞用字,亦常常過於含糊。這並非我獨有的印象,也是學生論壇裏的主流意見。甚至有些 quizzes,連教授到底想問甚麼,我也搞不清楚。感覺上,AI 兩位教授不是很 well prepared,有點急就章,不過他們的 lectures 很有啟發性,例如有一處談到 A* search,教授問,A* search 行得通,當中的 intelligence 究竟從何而來?要留意,並非人人也將 search method 當是 AI 的,例如早年深藍擊敗國際棋王卡斯巴洛夫,後來負責設計算則的許峰雄來港,就提及他的算則不過是 brute-force search,算不上是 AI。然而教授的問題,為何 A* search 行得通,就真的令我不禁要停下來,想一想,而他的答案,也令我有恍然大悟之感。

相比之下,ML 的教授較注重包裝,無論是 presentation 抑或 website 的設計都很講究。ML 的教授 Andrew Ng 風格有點「執手教」,即是連很顯淺的東西也唯恐你不明白,所以解釋得很仔細。要解釋詳盡但不冗贅,並非人人都做得到,華人尤其傾向太注重技術細節,令人失去 big picture,沒有 motivation,而 Andrew Ng 是罕見的例外。不過和 AI 課相比,我還是覺得 AI 課較能刺激思考,不知是否西人與華人的治學方式始終有別。只是現在始終開課不久,日後也許會有所不同。

儘管 Andrew Ng 的 presentation 很好,但也有些我不喜歡的地方,尤其是他有時舉一些很不設實際的例,很容易「教壞人」。譬如他解說 linear regression,以樓價與樓面面積的關係作例子。樓價的研究確實有用得上 linear regression 的地方,但是實際做法是有成例的,例如樓價幾乎一定要 take logarithm,而且,由於樓面面積幾乎一定不是決定樓價的唯一主要因素,若不考慮其他因素(例如地區、座向、層數、交通等等),regression 得出來的結果差不多肯定沒用,但是引入其他因素的話,又幾乎必定牽涉 hedonic regression 的概念。實例可以淺化,但不能偏離正軌,「老作」一個例子,然後硬套入現實場景,很容易誤導學生,令他們以為隨隨便便放幾個變數,就可以做 linear regression。其實隨便抽一本計量經濟學 (Econometrics) 的書,也可以找到許多實例,若無實例在手,還是只講抽象例子為妙。

此外,ML 課的內容也不時有錯。ML 要用到其他學科的技巧,而教授不是那些科目的專家,所以犯錯也情有可原,但是向學生胡亂解釋,就會造成真正問題。例如課堂中有處(大意)指,若要 minimize $\|X\theta-y\|^2$,其中 $X$ 是 $m\times n$,而 $n$ 遠大於 $m$(亦即 $X$ 是闊闊的矩陣),就應該用 gradient descent 而非 normal equation 來解決,原因是在 normal equation 之中,要計算 $(X^\top X)^{-1}X^\top$ 的話,由於 $n$ 很大,會很花時間云云。問題是,由於 $n>m$,$X^\top X$ 並不滿秩 (rank-deficient),所以它根本就不能反逆!最奇怪的,是 Andrew Ng 於 lecture 中有提及 pseudoinverse,可見他應該知道,當 $n>m$ 的時候,我們要計算的,應該是 $X^+$ 而不是 $(X^\top X)^{-1}X^\top$。為何仍有上述錯誤,真是木宰羊。(又後記:先前我跳過了許多我本身懂得的內容,現在打開來看,才發現教授並不真正熟悉 multiple regression ── 在 "normal equation" 的 video 約 10:23,他說用 Octave 解 normal equation 的時候,應該用 $\theta=\textrm{pinv}(X'\ast X)\ast X'\ast y$。技術上這沒有錯,但一般通用、等價而且較簡單的答案,其實是 $\theta=\textrm{pinv}(X)\ast y$,實際計算上,我們更罕會先算 $\textrm{pinv}(X)$,再算 $\theta=\textrm{pinv}(X)\ast y$,而是用諸如 QR factorisation 等等的數值方法尋求方程式 $X\theta=y$ 的解。Andrew Ng 取 $(X^\top X)^+X^\top$ 而捨 $X^+$,令人愕然。)

課堂中有關 feature normalization 的討論,更是完全錯誤。教授說 feature normalization 的目的,是為了令 gradient descent 加快收斂,但這兩件事,其實風馬牛不相及。試想像,若 features variables 未 normalized 之前,objective function 的 contour plot 本身已是同心圓狀,那麼,經過 feature normalization,contour plot 變成橢圓形,gradient descent method 豈非收斂得更慢,而不是更快?真正要改良 gradient descent,化橢圓為正圓,應該用 conjugate gradient method。Feature normalization 其實只是單純地從按每個 feature 的數值範圍 ── 而非 objective function landscape ── 去改變該 feature 的 learning rate,與加快/減慢 gradient descent method 的收斂,關係不大。

ML 的功課也設計得很奇怪。第一週的功課有兩部份,首部份是 ordinary linear regression,必答;第二部份是 multiple regression,是 bonus part。教授大概想弄得愈淺愈好,結果所謂功課,不過是在每個教授預先寫好的 script file 中加入一行指令。然而 multiple regression 部份要求加入的程式指令,其實與 ordinary linear regression 部份的完全相同,因此只要 OLS 部份答對,就等於懂得 bonus part,根本沒有額外挑戰。

另外,教授聲稱可以用 Matlab 或 Octave 來做功課,但是 submit 功課的 script file 其實呼叫了 Octave 的 urlread() function,所以 Octave 其實是不裝不行。然而我電腦 (Windows XP) 上的 Octave 又好像很 buggy,只要呼喚任何 plotting functions 就會 crash(後記,問題已解決;詳見此),令我不得不先用 Matlab 做好功課,再用 Octave 提交,但校方提供的 Octave script file,又時不時與 Matlab 不相容。例如 Matlab 的 function 應該用 "return" 來結束,但 ML 的 Octave script file 就用 "end";向量的長度,在 Matlab 是 length(),但是 ML 課的 script 就用 Octave 的 numel()。結果我要先修改那些聲稱與 Matlab 相容的 Octave script files,才可以做功課,十分麻煩。

2011年10月14日星期五

亞里士多德的師公

【明報】特首斥黃毓民爛仔答問全文
曾蔭權:無論是孔子或是亞里士多德,或是現在的政治家,現在的政治體制,都不會認為講粗口、粗暴語言、粗暴動作是市民合適的政治倫理,就是這麼簡單。
亞里士多德嘛,他的師公蘇格拉底,是因為批評雅典權貴,批評社會不公而遭逮捕處死的。當然,蘇格拉底的罪狀上所寫的,絕非「批評權貴」或「批評社會不公」,而是「腐蝕雅典青年思想」啦,令人不信神之類。羅織道德罪名,從來都是當權者的好戲,否則又如何將公眾焦點從官方的失誤之中錯開呢?

書釘偶拾之英國文官制度 (I)

John Greenway, Celebrating Northcote/Trevelyan: Dispelling the Myths, Public Policy and Administration, 19(1):1-14, 2004.

昨日行政長官曾蔭權發表任內最後一份施政報告,回想他上任之初,不少市民都寄望甚殷,誰知七年下來,政治敗壞,威人威威,官商勾結,貧富懸殊,本應遠比腳痛公熟諳民情與政治的曾蔭權,竟落得比前任更灰頭土臉的下場。繼「商人治港」,「公務員治港」似乎亦告失敗,中共港澳辦主任王光亞甚至指香港「成也英國,敗也英國」,不過坊間一直對於「公務員治港」是否失敗,或政府管治失效的原因,看法十分分歧,例如陶傑 (2005, 2008a, 2008b)、林行止 (2011) 與王岸然 (2011),就各有獨到見解。

英國統治了香港一百五十多年,香港的基本法制與文官制度皆師承英國,但英國現代文官制度之設,實在比香港還晚,歷史未如一般人所想悠久。昔日英國並無統一文官制度,各部門皆採取酬庸 (patronage) 方式,由大臣或部長延攬及任命下級官員,令裙帶關係與貪污充斥。一八五三年,財相葛雷斯東 (William Ewart Gladstone,日後成為英國首相) 制訂預算案時,發現他那班往日由其他政客安插的手下,根本無力提出任何有用的建言,於是決心改革,委任前私人秘書羅富國爵士 (Sir Stafford Northcote,第二十任香港總督羅富國的祖父) 與財政部長杜維廉爵士 (Sir Charles Trevelyan,是1954年擔任首任英國駐中華人民共和國代辦的杜維廉男爵的伯祖父) 研究改革方案。兩人於十一月底提交建議初稿,次年一月定稿,這份後世稱為 Northcote-Trevelyan Report 的報告書,掀起了英國文官體制改革的序幕。

根據一般教科書的說法,羅/杜報告書是現代英國文官體制的基石,許多我們現在習以為常的文官制度特色,皆源於羅/杜報告書。例如:
  • 公開考選 (open competition) ── 公務員乃公開招聘,以考試選出。
  • 分層 ── 將公務員分為兩層,前者由具有寬闊視野的通才擔任,負責制訂各部門政策,亦可隨時掌管其他部門,而後者負責日常的流水作業。香港政府的政務官 (AO) 即屬前者,而行政主任 (EO)、技術官僚與其他文員或低級公務員,即屬後者。
  • 論績升遷 (promotion by merits) ── 公務員的升遷,應以工作表現而非年資作準。
  • 常任 (permanence) ── 公務員乃長期供職,並不因政權更替而解任。
  • 政治中立 (political neutrality) ── 公務員不應因自己或服務對象的政見而有所偏私。
  • 匿名 (anonymity/facelessness) ── 公務員就像無名公僕,只須忠實地為政府首長或大臣制訂或執行政策,毋須負上政治責任。
然而,根據文首提及的 Greenway (2004) 所述,現代英國文官制度的部份特色,其實並非源於羅/杜報告書,而是由其他複雜或獨特政治因素產生。羅/杜報告書的部份本意,亦遭不少教科書作者誤解,不過羅/杜報告無疑對日後英國的行政改革造成深遠影響。

羅/杜報告發表後,獲英國統治階層廣泛傳閱。剛好克里米亞戰爭 (1854-1856) 爆發(以前香港小學生熟知的「提燈女郎」南丁格爾,就是因此戰成名),英軍指揮官與後勤部門顢頇無能,造成己方大量傷亡,暴露了軍人買賣官職之禍害,激起民間大肆批評,紛紛要求改革。可是,由於既得利益者的重重阻力,報告書的建議,要到一八七○年葛雷斯東擔任首相之後,才開始認真施行。因此英國本土的行政改革,起步得比她兩個屬地 ── 印度與香港 ── 還遲。實際上,初期香港設立的公務員制度,才是大英帝國各地效法的對象。

首位意識到港府需要作行政改革的,是第四任港督寶靈 (John Bowring)。寶靈是史上少見的語言通,懂得約二百種語言,並會說其中一百種,但他在任期間,港府通曉中文的官員,除他以外,就只得時任總登記官 (Registrar General,日後改稱華民政務司) 兼撫華道 (Protector of Chinese Inhabitants) 的高和爾 (Daniel Caldwell) 一個,而高和爾本身又涉嫌勾結海盜黃墨洲。有見及此,寶靈主張從英國招聘受過良好教育的青年官學生 (Cadets) 來港,學習中文然後成為公僕,令政府有可靠的官民溝通渠道。

寶靈是最後一位兼任全權公使駐華商務總監 (Her Majesty′s Plenipotentiary and Chief Superintendent of British Trade in China) 的港督。除了於港府之中,他還打算於駐華使團內實踐他的主張,只是後者的官學生所學的,是中國官話而非廣州話。寶靈成功說服外相卡靈頓伯爵 (Earl of Clarendon),取得外交部撥款推行計劃 (Eitel 1895, p.300),相比之下,港府的開支要先經英國財政部批准,結果就沒那麼幸運。寶靈上任之前,歷屆港府皆入不敷支,要由英國財政部年年資助(鄧樹雄 2003)。儘管寶靈履新之後一年(即一八五五年),港府即首次錄得財政盈餘,但不知英國財政部是否見慣港府「大花銅」而充滿戒心,寶靈始終不能於任內「成功爭取」撥款,在香港推行官學生計劃。

寶靈的構思,由他的繼任人羅便臣 (Sir Hercules Robinson,任期為 1859-65 年,勿與第十一任總督羅便臣 Sir William Robinson 混淆) 實踐。羅便臣乃海軍出身,一八五九年就任香港總督時,年方三十五。他上任後,九龍因第二次鴉片戰爭而併入香港版圖。霎時間,香港華人數目暴增,但高和爾又因為瀆職而遭解僱,令解決香港官民之間的溝通問題更形迫切 (Tsang 2007, ch.2)。銳氣十足的羅便臣向殖民地部提交了官學生計劃,建議從至少三間英國學院安排公開考試,選取三名官學生。羅便臣表示,此舉既可為港府羅致傳譯,亦可讓港府揀選通曉中文的人出任高官。也許有見於港府自寶靈開始,一直審慎理財,庫房不斷累積盈餘吧,羅便臣的計劃最終獲得批准推行。時任殖民地大臣的紐卡素公爵 (Duke of Newcastle) 更對羅便臣的計劃大加讚賞,令此計劃日後成為錫蘭、海峽殖民地、馬來亞,以至許多英國在非洲的殖民地的公務員招聘制度的範本 (Tsang 2007, ch.2)。第二次世界大戰之後,「官學生」(Cadet) 易名而成「政務官」(Administrative Officers),也就是現在我們所稱的 AO。

羅便臣只革新了公務員的招聘制度,令年輕人也有機會迅速晉身高官行列。羅/杜報告或現代香港文官制度的其他部份,他並未觸及。日後香港的文官制度發展,實在受英國影響殊深(例如公務員政治中立),但就當時而言,除了印度例外,香港實在領先整個大英帝國,包括英國本土。

眨下眼又「狗噏」了這麼多。下篇,水繼續吹(但多數爛尾)。

伸延閱讀

2011年9月30日星期五

星期五雜炒

(一)Time to teach those around South China Sea a lesson
本地報章絕大部份都已被中共收編了,但有時為了銷紙,還是會販賣中國威脅論的。

《南華早報》今早報道,中共的《環球時報》有篇 op-ed 表示 "We shouldn’t waste the opportunity to launch some tiny-scale battles that could deter provocateurs from going further." 雖說大國勃起,財大氣粗,但說得如此 militaristic,乍看還是頗嚇人的。不過要留意,如維基百科所說,《環球時報》中英文版的內容與取態,其實往往不同,而且英文版是相當鷹派的。我上網看中文版,發現中文版原來邀請了多位作者就南海問題發表意見,當中有鷹派,亦有鴿派,但英文版就只得上述由署名龙韬的作者所寫文章。更甚者,上述粗體句子的原文是:「不要担心小规模的战争,那正是释放战争势能最好的方式。小仗打几下,大仗就可以避免。」儘管也殺氣騰騰,但英文版 "shouldn't waste the oppotunity" 那種想快點開打的意味,比中文版還強硬,令我疑惑,究竟英文版應視為中文版的繙譯,還是採用同一標題但更激進立場的重新演繹?

(二) 年看4277書 5歲童獲閱讀獎
方潤所言,當成推廣活動,頒獎給這些借書量多的讀者也無妨,不過當我讀這則新聞時,腦中閃過的,是以下新聞標題(請恕粗俗):
年昅4277條女 五旬漢獲觀鳥獎
(觀鳥,bird,西人對「女」之俗稱也。)

(三)與其讀4277本書,不如讀這一本
官商同謀;新牢騷集
譚壽文神父藐視法庭案 (1951);船山筆記

(四)「小雀啄大雀」露破綻 男子褲襠走私雀仔失敗
生果報這道標題起得真好,但內文有一段寫得頗為混亂:
男遊客曾企圖在南美國家法屬奎亞那蒙混過關坐飛機,但當他進入首都卡宴市的羅尚博機場時,因海關覺得他行為有異,於是馬上將他的車截停。警方經盤問後,要求他拉開褲頭,結果發現小蜂鳥,於是將他拘捕。
讀者也許要想一想,才明白該男子欲將蜂鳥偷運出境,只是甫扺機場(故尚未登機)就已給海關悉破。要寫清楚其實並不困難。也許本地辦報的成本大高吧,總覺得報章編輯非常馬虎。

2011年9月27日星期二

重構明代馬弔牌例(四)

結算
如前文所述,結算之前先要驗賞(「看賞」)。看賞用第一張底牌來扶正次賞,用第二張底牌來指控「假逵」。「假逵」的持有人,要向其他三家(不管樁散)各賠一注。

看賞之後,各玩家可計算手上的牌值多少注。首先是弔數,每一弔值一注(所以半弔值半注,-1 弔值 -1 注)。其次是賞牌,若玩家正本,每張上桌的正賞或扶正了的次賞皆值一注。之後是其他有獎組合,各組合與其所值注數可見下表(為求方便,弔與賞亦一併列出):



若手上牌張包含多重組合,則注數累計(「遇重款,即重開」),舉例:
  1. 我八牌之中,有百老 、千萬、萬萬、空沒文及八索上桌,而且八索扶正,所以有一弔(一注)、兩賞(萬萬及八索,共兩注)、大活百(三注)、三開(三注)與四紅(四注),牌張共值十三注。
  2. 我八牌之中,有九十、五萬、八萬、八索、空沒文上桌,亦有百老及六萬不上桌 ,而底牌面張為九萬,所以有一弔(一注)、三賞(九十、八萬與空沒文;共三注)、兩副小突(九十加五萬,與九十加八萬;共兩注)、小活百(兩注)、兩副小活百突(小活百加五萬,與小活百加八萬;共八注),牌張共值十六注。
  3. 我八牌之中,只得八萬上桌,其他有百老、六萬等等,而底牌面張為九萬。儘管八萬可扶正,但不正本,所以無賞。總計,有 -1 弔(-1 注)、死百(一注)、死百突(兩注),故牌張共值兩注。
計算完畢,即可開注。若樁家手上牌張值 n 注,即向其他三家各收 n 注,然而,若散家手上牌張值 m 注,他只可向樁家收取 m 注(若 m 或 n 為負數,即是倒過來繳付 |m| 或 |n| 注),所以開注只介乎樁散之間

開注之後,另要敲門。 若散家手持「大活百」(百老上桌而玩家正本),可向另外兩散家各收一注,所以敲門只介乎散家之間,不涉樁家。

從上述細節可見,馬弔的輸贏主要是樁散之爭,這解釋了馮夢龍何以認為「馬弔之法,三人同心,以攻一樁」。馮所著的《牌經十三篇》也提及散家之間不妨相讓,不過玩家的輸贏,始終是個人之事,而非由團隊分擔,散家實際上有多同心,我實在懷疑。

馬弔開注,非常依賴百老一牌。若無百老在手,玩家基本上難有有獎組合,只可從弔與賞獲利。也許為了雨露均霑,清代的弔例加入了大量賀例與賞例,但這反而令弔例變得太過繁複。若無弔譜在手,我懷疑一般人根本無可能記清當中有如恆河沙數的各種名目。牌藝史家一般將馬弔的沒落,歸因於明代遺民對此亡國之戲的口誅筆伐,但是弔例本身過份膨脹,與清初遠比明末執行得嚴厲的禁賭法規,應該也是馬弔失傳的原因。

耐人尋味的,是天九與馬弔有一些非常相似的特色。天九有「八枝牌」(原為「八隻大」),馬弔有「八桌全收」。盡贏有獎,這並不出奇。最奇的,是馬弔之中,七桌也可謂之全收,這與天九的「七枝牌」,有異曲同工之妙!腳例的「開注」部份說:
七卓亦謂之全收,以俱打倒也;若他人先得一桌,以後得七桌,不算。
「他人先得一桌」是甚麼意思?腳例的「名目」部份說:
得牌曰上卓,得二牌曰正本,多曰弔,被弔不正本曰死。
兩句放在一起看,意思就清楚了:若玩家能先取七輪,即使餘下一輪輸掉,只得七桌,亦算全收,因為無論贏得餘下一桌的對手是誰,對手所得的也不過是死牌(被弔不正本曰死)。故此,先取七桌,就等於提前保證打倒所有對手(以俱打倒也)。反之,若有對手於頭七輪當中某一輪取得一桌,則不鬥到最後,仍不知對方所取一桌是否死牌。

(後記 2014-08-26:以上一段,源自跟化名「我行我速」的讀者的討論。我本來認為「他人先得一桌」的意思是「給對手奪了首桌」,因此「七卓亦謂之全收」,就是說玩家要取得首輪,並一共取得七桌。我指出這與打天九的「七枝牌」規例有點相似。後來「我行我速」君留言,認為「七卓亦謂之全收」的意思,玩家也許須先取七輪,比我原先所想更貼近打天九的玩法。重讀一次腳例,發現理應如此。謹此向「我行我速」君致謝。)

前三篇提過一些天九與馬弔相像的地方。有些諸如弔數、賀牌等等,還勉強可以說是一般鬥牌遊戲都有的特質,然而馬弔數頭家的方式,以及上表中「八桌全收」這個組合,卻令我不得不懷疑兩種遊戲發展,真有相當糾結的地方。

代賠罰例
除了本系列前述各項規則,馬弔還有不少罰例。罰例分三種,一種要求違規者代付其他人的部份損失,另一種,違規者要繳付定額罰款,最後一種會規限玩家的行為,例如強制玩家滅牌、免鬥等等。本節先說第一種。

前文提過馬弔有兩條特殊的鬥牌規則,就是不能放生百老,以及不能放生樁家的賞牌。放生散家,要代樁家賠償;放生樁家,要代其他散家賠償。若代賠的對象已正本,只須替他賠一注;若未正本,則代賠兩注

留意玩家代賠的注碼取決於代賠的對象有否正本,而非取決於所放生之牌所值注碼。放生百老與放生賞牌兩種情形也是累計的。舉例:



腳例對以上罰例的細節,其實寫得不清不楚。首先,若我故縱樁牌,令樁家於以後兩輪皆以先手打出賞牌,那究竟是放生了一次還是兩次?為求簡單,本重構牌例只視此為放生一次。其次,規則所定的的代賠數額,是否只是一個上限?若代賠對象的損失未及此額,是否不用賠足?以上例來說,若 B 本來只輸一注,那我是否只要代他賠一注就夠?最後,腳例亦無寫明,違規者代賠的,究竟是各人計算淨輸贏之前的損失,還是別人的淨損失?舉例說,假設我違規放生了散家 A 的百老。終局之後,頭兩張底牌為九萬及八萬,而各人上桌的牌張為:
  • 樁家:一文錢。
  • A :百老、九十。
  • B :九索、空沒文、半文錢。
  • 我:萬萬、七萬。
若未計算淨輸贏之前就開始代賠,那我要代 B 賠一注,用來應付散家 A 敲門。然而,若代賠的是 B 的淨損失,那麼 B 贏樁家三注(一弔一注、九索賞一注、空沒文賞一注),給 A 敲門敲走了一注,總計贏兩注,沒有淨損失要我代賠。

腳例的字裏行間來看,違規者應代賠的,是未計算淨輸贏之前,任何由假逵或任何開注組合所單獨引起的損失,直至所賠達到罰則規定的上限為止。然而這種做法的手續比較繁複,若讀者只想領略馬弔遊戲的風味,而不拘細節,大可將罰則規定的數額視為定額處分,而非上限。譬如上面第一個代賠範例中,我只須罰與樁家兩注,A 一注以及 B 兩注就可以,不必考慮各人有何組合或淨輸贏幾多,做法比較簡單。

腳例其實還有第三條「不准放生」的罰則,它實在太有趣了,令我忍不住將原文抄錄如下:
出十門千、萬,致活百老者,及故縱樁牌活賞者,鬭法低矢致活樁家者,俱代人認開數
這句開頭所指,就是不得放生百老與樁家賞牌,但之後這條 …… 天呀!鬥得差勁都要受罰?!如何打牌才算差劣,大有商榷餘地。本系列的文章重構了明代馬弔的主要玩法,總算有點貢獻,希望讀者不要嫌我學力/想象力/筆力低矢,完全不詮釋此條吧!

腳例還規定,若發生以下四種情形,而且玩家的失誤對其他人的得失有影響(「四野如有關係」) ,則玩家要代賠:
  1. 誤出【未輪到玩家出牌,玩家已誤出】。
  2. 誤捉【即用了較小或另一門的牌來捉牌】。
  3. 所出非賞而越牌越次【即某上家所出的並非正賞,但玩家未輪到自己滅牌就先滅】。
  4. 顯滅【滅牌時牌面向上】。
這四種情形本身並無含糊之處,問題是如何界定它們有無影響別人的得失。由於灰色地帶太廣,難以寫成清晰而且無爭議的規則,所以此處我就同樣當自己「時運高,睇唔到」好了。不過腳例之中,以上四種情形除了要違規者代賠之外,還要付定額罰款,詳情請看下一節。

其他罰例
腳例有十多條罰例設有定額罰款或規限玩家的行為,懲罰可發生於派牌時,亦可發生於鬥牌時,有些罰例亦會導至免鬥,強制終局。由於原文十分淺白,所以我將原文抄錄如下,只在有需要時以方括弧【】加註:
  1. 應洗牌不洗者罰一注,仍洗。
  2. 不應洗誤洗者罰一注,改正【即返回正常程序;此條中,即改由原來應洗牌的人洗牌】。
  3. 洗畢見百老者,罰一注,另拈樁。
  4. 洗畢錯授人者,罰一注,改正。
  5. 拍牌見百老者【即派牌發現洗牌後百老牌面向上】,罰一注,另拈樁。
  6. 誤分者【定義下詳】,【若獲派牌者】未看牌罰【派錯牌者】一注,改正;已看牌罰五注,給有百老之家,免鬭(誤多、誤少、錯分、不輪分而分,俱謂之錯【多派或少派了牌張、派錯牌給別人、玩家並不負責派牌而派牌,皆算「誤分」】)。
  7. 分牌失手,翻轉白者【不屬賞牌、百老或其他紅張者】一注、紅二注、賞三注、百老四注,所罰給被翻之家,惟翻百老者另拈樁。
  8. 誤出者罰二注,另改正。
  9. 誤捉者罰二注,作滅。
  10. 所出非賞而越牌越次者,罰二注。
  11. 顯滅者罰二注。
  12. 竊看底牌、面張者,罰二注。
  13. 竊看他人滅牌者罰二注。
  14. 相顧抽張【互相換牌】及明言【向人提示自己手上有何牌張】者罰五注。
  15. 誤出至第二牌者,舉出免鬭【若被人發現,則免鬥,強制終局】。如有百老與賞家,舉出罰如分錯例【若發現者有百老或賞牌,則按前述「誤分/分錯牌」的罰例施罰,亦即罰五注給發現者,兼免鬥】。
  16. 多張者及少張者【手上牌張比應有的多或少,類似打麻雀的「大/小相公」】,俱不准捉(多張則留門既多,未免有弊,若少張則直作已滅,故俱不准捉,雖賞亦不論【就算手上有賞牌,亦不准打出來奪賞】)。【所以,】末張多者不准留(謂末張故留二為觀望也)。
以上,除非指明交付對象,否則所罰注碼一律放入「官堆」之中。官堆即公共彩池,用香港俚語來說,就是將注碼交給「阿公」;用「六合彩」比喻,就是累積獎金。每局無論是正常結束抑或中途因免鬥而強制中斷,若終局時有人手持大活百,則可奪官堆之錢,否則每人加一注入官堆,累積獎金。

以現代眼光來看,這十多條罰則未免顯得瑣碎或多餘。若讀者只想與三五知己試打馬弔,不妨將本節所述罰例全廢。

尾聲
馮夢龍《馬弔腳例》的主要規則,至此重構完畢。相信讀者現應明白,坊間所謂「馬弔即古代的麻雀」,是一種多麼荒謬的誤解了。如讀者對本系列文章有任何意見,或發現當中有任何錯漏,請不吝賜教。(本系列完)

馬弔腳例》、重構明代馬弔牌例(一)(二)(三)、(四)、牌例比較

(關鍵詞:馬弔、馬吊、打馬吊、馬吊牌

2011年9月26日星期一

《流水》

原來電鋸辦的網上小說雙月刊《流水》經已出版。比起文學雜誌或實體的小說月刊,《流水》的格調暫時令我覺得更像同人誌,因此倍感親切。謹祝《流水》一 link 風行!

2011年9月25日星期日

重構明代馬弔牌例(三)

鬥牌
馬弔的基本鬥牌方式非常簡單,每局分八輪出牌,每次每人只出一張。腳例沒有說首輪由誰任先手,不過清代馬弔是頭家(而非樁家)起手的,這裏亦假設如此。以後各輪,由上一輪的勝者任先手。先手出牌之後,從下家開始按坐次打擊(術語稱「」)或墊牌(「」)。捉牌時牌面向上,滅牌時牌面向下。捉牌必須用同門較大的牌,亦即香港俚語所謂「格食格」,例如十字只捉十字,索子只捉索子。各門牌張順序,見本系列首篇的「牌式」一節。玩家每勝出一輪,我們就稱其所用之牌「上桌」,或該玩家獲得一桌。一局馬弔有八輪,因此玩家每局最多可得八桌。

出牌策略當以攫取最大利益為目的,但利益多寡牽涉較繁複的結算規則,這些我們下篇才談。由於百老地位特殊,腳例規定,玩家須以「千萬」或「萬萬」留守,不可隨便使出,以至放生他人的百老,但以下情況不在此限:
  1. 若玩家同時持有千萬與萬萬,可打出萬萬以奪「」(後詳)。
  2. 即使百老未露面,若玩家手上只餘十字門,並且有人(不一定要玩家本身)打出過十字門的牌張,則不用再留守。
若有人違規,以至放生百老,違規者要受罰,負擔其他玩家的部份損失(詳情見下篇)。留意,若玩家自願受罰,他是可以違規的(「願認者聽」)。反過來說,若結果百老無法勝出,違規者亦不用受罰。

腳例亦不許玩家故意放生賞牌(定義後詳):若玩家於某一輪故縱樁家(即可捉而不捉),令樁家得勝並於下一輪取得先手,將賞牌上桌,則玩家要受罰,代賠別人的部份損失(詳情見下篇)。

查牌
儘管腳例並無討論,但由於玩家可能違規滅牌,所以上述兩項「不得故縱」的特殊規則,似乎必然導至一個結果,就是玩家事後可以查牌,否則無法找出違規者施罰。腳例除了暗示捉、滅的牌面應分別為向上與向下之外,完全無提過各人使出的牌張應如何擺放。為方便查牌,我建議玩家採取以下方式:
各人所出之牌,不論勝負,須按回合順序排列在自己面前。上桌之牌要推前半個牌位,以便與落敗之牌區分。終局後,若懷疑有人違規滅牌,違規者應自動投案,否則玩家可翻開各人所滅之牌檢查。
下圖是範例。玩家將牌由右至左排列,顯示他第一、五兩輪所出的二萬及九十遭人擊敗,但於第二、三、四輪將九索、三萬與四萬上桌,並於第六至八輪滅牌。


如讀者想到更好的做法,請不吝賜教。

結算概念之:正本、弔
如首篇所述,鬥牌的收入分兩種,一種是弔數,一種是組合得分。弔數的計法,憑上桌的牌數決定。取得兩桌稱為「正本」,得零弔;未正本者各得 -1 弔(留意這裏我刻意使用負數而不說「輸一弔」,原因下詳);取得三桌或以上就稱為得「」。只有得弔的玩家的弔數才是正數。

這種超越某個門檻才有收入的玩法,令我聯想起打天九的戙數與打六虎的湖數。打天九以四戙歸本,敗者只有取得多於四戙,方可從勝者(結牌者)處獲利;打六虎(或六湖)則以取得六「糊」(或「餬」,本字應為「湖」)為「食糊」的必要條件。客家六虎牌乃明代「馬弔」與「看虎」的嫡傳後代,有相同精神的規則並不出奇。天九歷史久遠,一向與各種基於馬弔花色的「葉子戲」分庭抗禮,可是以四戙歸本的做法,以及與馬弔相同的數算頭家方式,都只是清代才有,並未見於明代的「鬭天九」。天九與馬弔的發展,到底有何相互影響?這是一個饒有趣味的問題。


回說弔數。弔數並非桌數,兩者的實際關係,按腳例可表列如上(表中除了四行說明之中為弔數以外,其他各行數目字為桌數)。這個表驟看起來相當複雜,實際卻非常簡單 ── 凡有弔者(取得至少三桌),無論有多少桌,皆只得一弔;唯一例外,是上表所謂「合弔」的情形:當兩家有弔而只得一家未正本(故餘下一家剛好正本),兩位有弔者只獲半弔。腳例形容未正本者「輸一弔」,合弔者「分贏一弔」,而其他情形有弔者「各贏一弔」。這些字眼其實相當誤導,它彷彿暗示玩家所贏弔數乃他人所輸,而弔數的總和為零。然而事實並非如此,例如上表第一行的弔數已非零和(得八桌者一弔,其他三人各 -1 弔)。弔數如何結算,我們下篇再談。

結算概念之:賞、假逵
陳洪綬《水滸葉子》中的李逵
(圖片來源:維基共享檔案
本節所謂「」乃鬥牌之賞,屬組合得分的一種,並非異賞。腳例將某些牌張視為「正賞」,凡正賞上桌,兼且正本,即有賞注。正賞不上桌,或玩家不正本,均不獲賞(腳例稱「死賞」)。

正賞即是正選的賞牌。四尊之中,任何一張皆為正選,而僅次於它們的四張牌(即千萬、八萬、八索與半文錢)為候補,稱為「次賞」。讀者也許記得馬弔開局後,還剩八張底牌。當鬥牌階段完結,玩家須翻開最頂那張底牌(「面張」)。若此為正賞,則同門的次賞可扶正(所以四次賞之中,最多只有一張可代替正賞)。扶正了的次賞,一樣要上桌及正本才有賞注。

除了面張,玩家還要掀開第二張底牌(「面葉之次」) 。此時,有趣的事來了 ── 若該底牌為正賞,而某人將同門的次賞上桌兼正本,則腳例認為該人「舢舨充炮艇」,要罰他向三家各賠一注!

這種不幸的情形,腳例有兩處稱為「假逵」,一處稱為「假達」,那個才是手民之誤,請讀者自行定奪,我暫以前者為準。明、清兩代的葉子均印有水滸人物名字,「假逵」自然令人想起黑旋風李逵,不過「李逵」於明代陸容所著的《菽園雜記》中只是五萬貫,而在明代潘之恆的《葉子譜》以及前文提及,由大英博物館所藏的客家六虎牌中,均為四十萬貫,並非正賞,甚至在明末畫家陳洪綬所繪,行酒令用的《水滸葉子》酒牌之中,「李逵」也只代表九十萬貫。如果腳例以李逵比喻「假冒的正賞」,應該有牌張以外的理由,例如《水滸傳》第四十三回,有李鬼假冒李逵的情節,也許就是「假逵」的出處。

說過鬥牌及一些尤關結算的概念之後,下一篇即可談結算的細節。(待續)

馬弔腳例》、重構明代馬弔牌例(一)(二)、(三)、(四)牌例比較

(關鍵詞:馬弔、馬吊、打馬吊、馬吊牌

2011年9月23日星期五

重構明代馬弔牌例(二)

異賞 
鬥牌之前,玩家必須報告自己手上有無稱為「異賞」的奇牌組合。若有,此局強制終止,不用鬥牌,手持異賞者亦可向其餘三家收取注碼(「如牌有異賞,三家齊賀」),不過「百老」(即百萬)於馬弔中有特殊地位。手持百老者,可免賀其他人的異賞(「止有百老之家免賀」)。

前文提到馬弔鬥牌的收入,分為弔數與組合得分兩種,其中弔數類似打天九的戙數或客家六虎牌的湖數,憑玩家得牌數目而定。腳例規定,儘管有異賞時不用鬥牌,但有異賞者以「全弔」論,亦即除了獲得異賞的賞注之外,還獨贏一弔。

異賞共有八種,名目與賞注如下表:


以上「四尊」指四門最大的牌,即尊萬萬貫、尊九萬貫、尊九索、尊空沒文,而「四極」指四門最小的牌,亦即二十、一萬、一索、九錢,所以「四尊四極」指玩家手持四尊與四極八張牌。至於「八紅」,腳例並無解釋是甚麼,下一節我們再作討論。

腳例原文並無說明如何處理多於一人握有異賞的情況,譬如有人手持八張索子,另一人手持八張文錢,兩人都有「渾成」。這種情況,大概一生人也不會遇到一次,但絕非不可能。這引起幾個問題。

第一,如何過樁?原本腳例由手持異賞者奪樁,但多人有異賞,卻不可同作樁。為求簡單,我建議按坐次(從頭家而非樁家算起)由首位有異賞者奪樁。若該人恰巧為樁家,則連樁。

第二,異賞本來是三家賀一家,但多人有異賞時如何辦?按常理,我建議每位有異賞者皆向其他三家收數

第三,有異賞者本以全弔論,亦即獨贏一弔。若二人同時有異賞又如何?由於馬弔的一弔只得一注,而腳例亦有鬥牌後兩人分贏一弔的情況(即每人半弔;這是前文提及一「衝」的數目以雙數為宜的理由),所以按常理,若二人有異賞,可分贏一弔。然而,若三人有異賞,除非一衝的數目為三的倍數,否則此法不可行。因此,我建議凡有異賞者,皆視為獲得一弔

八紅
腳例雖另有解釋何謂「四紅」(百老、千萬、萬萬配空沒文,乃普通牌組,不屬異賞),卻沒說明「八紅」的意思。從字面看,四紅應該是八紅的子集,但異賞中既分別有「八紅」以及「八紅有百老」(即八紅當中有一張為百老)兩種名目,可見馬弔的「紅張」最少有九隻。然而其實際數目,以及四紅以外的其他紅張為何,現已不可考,我們只能猜測。

《馬弔腳例》是明代唯一遺留的弔例,但我們可從明代其他牌戲或清代馬弔為起點作推測。明代潘之恆的《葉子譜》記載了三大葉子戲,除了馬弔,還有「看虎」與「扯張」,其中扯張之中有「五紅」名目,就提到九張算紅的牌 ── 萬萬、千萬、九萬、八萬、九索、八索、九文、八文、空沒文。若馬弔亦取此九牌,加上百老,就有十紅張,而所謂八紅,意指玩家手握此十牌之八。然而扯張終究只用馬弔牌其中三十葉,所以牌張算紅的原因未必與馬弔相同。

我們也可以清觀明。清代馬弔牌張分「紅、青、趣」三種,紅張包括賞(四尊)、肩(四次賞,即僅次於四尊的四張牌)及百老,趣即四極,而青張乃其餘居中的牌,故此清代的紅張應有九隻。

然而我們不應太快下結論,認為清代的紅張即明代的紅張。原因之一,乃清代的弔例遠比明代繁雜。以清雍正年間由退庵居士所編的《弔譜集成》為例,它集合了多份弔譜,當中有「八紅」名目,但同樣沒有說明其意思;書中《賀例》還有「十紅聚會」名目,附註「九十子在內」,可是《賀例》另一處卻說「九十非紅」,由此可見,即使是清代弔例,也未必要紅張才算紅。

Tổ Tôm 的牌張(圖片來源:Thú chơi tổ tôm ngày Tết
另一個原因,是紅張的定義可能有變。我們知道大部份後世的中國紙牌都承繼了明代葉子的花色,其中只有客家六虎牌完全保留葉子四門,其他紙牌則去掉十字門,只留千萬。有趣的是,不少這些紙牌都有幾張牌帶有紅印,而這些紅印很可能就是用來識別有特殊意義的紅張。舉例說,前文提及那副大英博物館藏的清末六虎牌,與現代的六虎牌、南通長牌及越南的 Tổ Tôm,均分別有不同的紅印牌:



儘管以上各牌具皆源自葉子,但各遊戲的牌制與玩法始終與馬弔有別,要從它們的紅張推敲明代馬弔的紅張,實在困難。更甚者,即使同屬六虎牌,上述清末與現代兩副的紅印牌已經不同。著名民俗學家 Stewart Culin 於其著作 Korean Games: With Notes on the Corresponding Games of China and Japan (1895, p.140) 中更記載了一副從廣州購入,有四十張的六虎牌(書中稱為 Lut Chi),當中仍保留「萬子」(即馬弔的萬萬)與「千子」(即千萬),但紅印牌有八張,分別為九十、八十、九貫(九萬)、九索、百子(百萬)、毛公(空沒文)、千子與萬子,又與前述兩副六虎牌有別。六虎如此,我們亦無理由認為明、清兩代馬弔有同樣的紅張。

現代六虎牌的八隻紅印牌
所以最終還是沒有答案,不過,若我們取用明代扯張或清代馬弔的紅張,似與明代馬弔的規則並不相悖,因此本文建議讀者可二擇其一:
  • 明代扯張:萬萬、千萬、九萬、八萬、九索、八索、九文、八文、空沒文,另加百老,共十紅張。
  • 清代馬弔:萬萬、千萬、九萬、八萬、九索、八索、空沒文、半文錢、百老,共九紅張。
免鬥
除了有異賞,若玩家手有以下「免鬥色樣」,亦可提出終局,不必鬥牌:
  1. 四極。
  2. 十字門滿五張。
  3. 餘下三門之一滿六張。
憑四極免鬥,其他三家(不管樁散或有無百老)須各賀一注,另外兩種免鬥色樣無獎。

腳例並無清楚說明提出免鬥到底是權利還是義務。照道理,若我是先手,兼有十字門的五張頂張,應該有很大優勢,提出免鬥並無好處。既然腳例有異賞之設,應該沒理由懲罰其他具優勢的組合。反過來說,若手上的免鬥色樣差勁,玩家亦自然會提出免鬥。所以我假設玩家有權但無義務提出免鬥。這就像客家六虎牌例之中,手持「五虎下山」的玩家可於派牌後宣告勝利,亦可放棄此權利,以求在鬥牌階段謀取更大利益。

腳例亦沒說明報告異賞與提出免鬥是否可同時進行。清代一些弔譜將一些「不鬥色樣」歸入「賀例」之中,因此異賞與免鬥似是同一階段。然而上述三種免鬥色樣之中,只有四極可賀,似與清代弔例有很大距離(四極於某些清代弔例中亦不屬免鬥色樣)。為求簡單,我假設若無人有異賞,玩家方可提出免鬥。(待續)

馬弔腳例》、重構明代馬弔牌例(一)、(二)、(三)(四)牌例比較

(關鍵詞:馬弔、馬吊、打馬吊、馬吊牌

2011年9月16日星期五

《Steins;Gate》:罕有、上乘、真正的時間旅行故事(一)

終於大結局了。《Steins;Gate》是罕有真正的時間旅行故事。我認為它不但為近年此類別之中的佼佼者,就算拿它跟經典名著相比,亦毫不遜色。

Steins;Gate》本是歷險遊戲,後來改編為同名電視動畫。我不諳日語,未玩過原作,不過從網上資料判斷,儘管動畫囿於長度而對枝節有所取捨,主線仍忠於原著,沒有自創情節;動畫畫風與原作不同,但仍相近,聲優則基本是遊戲的原班人馬。從 S;G 動畫故事水準之高,可想原作亦同樣出色。原作遊戲於 2009 年 10 月 15 日開售,開發商 5pb. 社長志倉千代丸,截至今年六月底(約開售後十九個月),銷量已突破三十萬。對一般歷險遊戲而言,年銷十多萬套,屬暢銷但不突出,然而 S;G 只有日語版,並非如一般歷險遊戲般有英語版或繙譯成多國語言,因此三十萬實在是驚人數字,不過更驚人的,是 S;G 的標價 ── 最便宜的 iPhone 版也賣 3,000円(約 300 港元),最貴的一款 Xbox 360 版更賣 9,240円(約 940 港元)。歐美一般新款歷險遊戲,售價只介乎 220 至 300 港元之間,即使名作如 Myst 系列或 Syberia 系列,初售時亦不超過 400 港元。S;G 賣這麼貴,只賣日語版竟也售出超過三十萬套,可見它多麼受歡迎。(也可見縱然日本經濟欲振乏力,日本人仍相當有錢!)

「時間旅行」是幾乎寫到爛的類別
許多有時間旅行情節的故事,其實都只將時間旅行當成一個 plot device。無論加入幾多花巧的影音效果,營造多麼震撼的穿越時間場面,「穿越時間」本身,在這些作品中都不過是過場情節,與一按鈕就「嗖」一聲轉移無異。就好像電影《The Final Countdown》(1980)、漫畫《漂流艦隊》(2004,台譯《次元艦隊》),或小說《The Axis of Time》(2004-2007) 三部曲,時間旅行不過是作者讓現代軍隊回到過往參戰的藉口,本質上它們是架空歷史演義,而非時間旅行故事。

這種以穿越時間為故事道具的現象,於眾多所謂「時間旅行」故事中不止普遍,還根深柢固,就連開創類別先河的名作,H.G. Wells 的《The Time Machine》(1895)[1] 亦不能倖免,當中所謂時光旅行,不過是到另一個世界獵奇探險。就算將時光機改為「時光馬桶」,或者改用念力穿越時間,甚至通往的並非未來世界,而是平行宇宙,亦不影響主要情節。

真正的時間旅行故事,必須牽連因果律(或顛覆它)。即使「因果」或「時光機」並非故事主體,亦應在故事中佔關鍵位置。這裏特別一提由 H.G. Wells 孫兒 Simon Wells 拍攝的改編電影《The Time Machine》(2002)。該電影加插情節,說主角的未婚妻意外身亡,才令主角製造時光機,以圖改變過往。然而反覆嘗試,其未婚妻仍死於非命,只是死法有別,於是他決意往未來尋求解決方法,電影至此也接上了原著故事。可是改編作的結局又與原著不同。原著中,未來世界難逃厄運,但在改編作當中,主角最後明白,若他能拯救未婚妻,就不會發明時光機;既然他發明了時光機,即無法拯救未婚妻。歷史的一致性不容許時間悖論,故主角難以干涉過去,然而他可以改變未來。於是他終於想通,與其無望地拯救未婚妻,不如拯救未來世界。這樣用一種時間觀去貫穿故事,才有時間旅行的味道。

The Time Machine (2002)
創作時間旅行最難的地方,在於這個 genre 幾乎已經寫到死。一方面,歷史不變論(人不能改變過去,時間旅者回到過去所做的事,本身已是歷史的一部份)、歷史局部可變論(例如前述《The Time Machine》的改編電影)、歷史可塑而脆弱論(故有「時間警察」)、平行世界[2](或近而不同的 personal past[3]),還有各種時間迴圈、時間悖論 …… 大凡你想得出的時間觀,差不多都有人寫過。另一方面,若要着力引入時間觀及描寫因果關係,作品就容易充滿匠氣。Robert Heinlein 的短篇名作《All You Zombies—》(1959) 中,少女給男人引誘上床,產下女嬰,後來女嬰遭神秘人擄走,最後謎底解開,原來少女日後變性為男人,任職時間警察;他回到過去,與少女時代的自己發生關係,擄走她產下的女嬰,並將女嬰帶回更遠的過去,讓她長大後成為少女時代的自己,維護了歷史的完整 ……。如此鋪排,可算極盡奇詭了,也是 bootstrap paradox 的典範,然而讀者可能覺得太過刻意,甚至變態。

比諸一眾前作,《Steins;Gate》的成就異常突出。作者不但在這個寫到爛的故事類別當中找到嶄新意念,還編織了一個處處牽涉因果律,非常曲折但又不失自然的長篇時間旅行故事,就連當中的敗筆,也有值得稱讚的地方。(待續)

相關舊文:看過情書,現在,很想見你

註:
[1] 根據維基百科,H.G. Wells 的《The Time Machine》並非近代首部時間旅行小說,亦非 Wells 於此類別的首部作品,但它無疑是令時間旅行小說普及的功臣。
[2] 嚴格來說,大部份採用平行世界觀的小說都不算時間旅行故事,原因是主角干涉的是另一個世界,故此不會影響原本的世界的因果關係。
[3] Personal past 的概念,可見於 Alfred Bester 的短篇《The Man Who Murdered Mohammed》(1958)。它與平行世界觀的最大分別,在於平行世界向未來分歧,但 personal past 卻是專屬於每個人,而且分立的過去。

2011年9月7日星期三

驅蜂新法?

天橋上人來人往,其中有兩名少女結伴而行。當她們快走到我跟前時,行人紛紛僵住。原來有一隻蜜蜂飛進人群之中。 其中一名少女竟然半帶驚恐,半帶亢奮地大喊:
×你呀, 蜜蜂!
而蜜蜂竟然又不再徘徊,逕直離去。

《驚喜挪威》

吳祥輝著,《驚喜挪威:台灣的國家記憶 挪威的心靈密碼》,遠流(臺北),2009 年初版,NT\$350。

此書為作者「國家書寫」三部曲的最後一部。第一部《芬蘭驚艷》以芬蘭歷史及作者於當地所見所聞對照台灣的狀況,令讀者反思台灣的路向。儘管作者所作比較有時牽強,對芬蘭又有過於美化之嫌,但大體上仍能啟發讀者。第二部《驚歎愛爾蘭》依循同一套路,只是英國之於愛爾蘭,未如俄國之於芬蘭那麼具壓迫感,用來比照中國對台灣,說服力就打了折扣。

到這一部談挪威,歷史重點自然放在挪威與丹麥及瑞典的互動之上。書中提到,挪威曾經與丹麥聯合,後來又經歷了四百年的瑞典殖民統治,可是 1905 年挪威國會表決獨立以後,挪威人又公投決定採用君主立憲體制,還找來了丹麥王子(後來的哈康七世)當國王。這種不囿於民族主義的國際眼光,也許相當值得台灣人(以至香港人)學習。

書中另一處提及瑞典的諾貝爾委員會於 1903 年(當時挪威仍受瑞典統治)將文學獎頒給挪威文學家班生,其敘述更令人共鳴:
一九○三年,班生獲獎。這份「貴重禮物」更是難以想象。用現在的話說,班生是「挪威獨立」的「分離主義」作家。當「統獨之爭」正酣時,瑞典竟然把這最高榮譽頒給他,美麗得不可想像。就像中國把最高榮譽頒給「疆獨」、「藏獨」人士,或是達賴喇嘛,可能嗎?

頒獎辭更「誇張」。瑞典學院以空前,也可能是絕後的話稱讚班生:「沒有任何國家的國歌,像班生為挪威所作的〈是的,我們愛祖國〉那麼動人。」

誰能想像,中國把最高桂冠頒給一位台灣人,讚譽他或她:「從來沒有任何一個人寫的國歌,像他(或她)寫的台灣國歌那麼棒。」這純屬假想,台灣從來沒有國歌。

瑞典人把諾貝爾文學獎經營得如此崇高,班生的致答辭也展現一代大文豪的風範:「多年以來,我和我的同胞致力追求挪威在聯盟國家中的地位。這種追求,對貴國是難堪的經驗。不過,挪威獲得平等的地位,應該也是貴國的光榮。」
上述兩處是全書最精彩的部份。此外,作者對「洋特法則」亦有有趣的探討。然而,比起前兩部曲,《驚喜挪威》十分肢離破碎。許多時,作者不過是於旅遊經歷之間,夾雜他對台灣的一些完全無關挪威的感想,感覺像是將一本遊記跟一本個人政論集生拼硬湊在一起,失卻了《芬蘭驚艷》那種自然的轉折。此外,作者對那些甚麼甚麼指數(今次是聯合國的「人類發展指數」),也去到盲目地強調的地步。重覆又重覆挪威的人類發展指數如何高,令我相當難奈。

總括而言,作者的「國家書寫」三部曲可說每下愈況。若非此書可從圖書館借出,我連在書店打書釘閱讀的興致都沒有,不過比起兩部前作,此書所用照片更怡人,喜歡看風景照的朋友不妨翻一翻。

2011年8月23日星期二

LaTeX+MathJax+Blogger test

Consider the $n\times n$ matrix
$$A_n = \begin{pmatrix}
0&1&\ldots&1\\-1&0&\ddots&\vdots\\\vdots&\ddots&\ddots&1\\-1&\ldots&-1&0\end{pmatrix}.$$
It can be shown that the characteristic polynomial of $A_n$ is given by $p(\lambda)=\det(\lambda I-A_n)=\frac12 \left((\lambda+1)^n+(\lambda-1)^n\right)$. So, when $n$ is even, we have $\det(A_n)=(-1)^np(0)=1$ and the eigenvalues of $A_n$ appear in reciprocal pairs, i.e. if $\lambda$ is an eigenvalue, so is $1/\lambda$.

See also:
  1. MathJax
  2. LaTeX using MathJax on Blogger

2011年8月1日星期一

Lonesome

一直以來都覺得 "lonesome" 這個詞語很怪。後綴的 "-some" 總令我腦海浮現出有許多人的景象,但既然孤獨,又何以伴着多人?當然,喧鬧的人羣中,也可以沒有一個值得交心的人,但是詞語的源起,應該沒那麼複雜吧。

Online Etymology Dictionary,"lonesome" 一詞可追溯至 1640 年代,而 "lonely" 則稍早,約初見於 1600 年。英語後綴 "-some" 視乎所配詞語,有多種解釋。放在 "lone" 後面的 "-some",似源自古代哥德語 "sama",即現代英語的 "same"。由此看來,我覺得 "lonesome" 應該有「依然孤獨」的含意,比起 "lonely",它更添幾分滄桑,多了恆久孤寂的感覺,不過起初是否真的這麼解,就不得而知了。

今日 "lonesome" 與 "lonely" 差不多是同義詞,而且比 "solitary"(獨處)負面,但是從大文豪 Samuel Johnson 所編的 A Dictionary of the English Language (1829),我們發現在十九世紀初,兩詞的解釋與分野均與現今有頗大差異。當時 "lonely" 可以指孤獨得想有人作伴 (want of company) ,或單純的獨處,但也可以指沉溺獨處 (addicted to solitude),因此就當事人而言,"loneliness" 可以是略帶負面(孤獨)、中性(獨處)甚至是正面(沉迷獨處)的情感。相比之下,當時 "lonesome" 一詞只指淒涼而孤單的景況,以現今的說法,大概就是 very lonely 了。

2011年7月30日星期六

2011年7月29日星期五

如果教師是妓女……

國民教育就是性病。

伸延閱讀:
  1. 我是如何當「妓師」的;刁民公園 
  2. 教師與妓女;庫斯克的床 
  3. 少看一點A片吧!;Fight for a Better Life 
  4. 教師比妓女;小小大力

2011年7月18日星期一

國民教育科示範題目

M區有30隻老鼠。假設每個老鼠籠只可容納一隻老鼠,而鼠王芬於M區放置大量空的老鼠籠,翌日有17個有老鼠,求M區餘下的老鼠總數 (X) 及鼠王芬捕捉到的老鼠總數 (Y)。

(a) X=13, Y=17
(b) X=13, Y=0
(c) X=30, Y=17
(d) X=30, Y=0
(e) 以上全部
請先試答,再看題解。

解答若依照普通算術,問題的正解是 (a)。然而,要正確地解答本題目,學生必須對中國國情、本地政情以及著名哲學家暨法律學者梁美芬的思想有透徹的理解。根據梁美芬的口述:
熟悉內地法律的法律學者、立法會議員梁美芬認為,當局對劉曉波的判刑過重,在內地同類案件,通常只判三至五年。她指,外國領事聲援劉曉波,有可能引致當局加重對劉的刑罰,「因為佢(中央)可能更加覺得,其實劉曉波不是劉曉波,而是好多外國勢力在背後,可能造成一些反作用,也不出奇。」(《星島日報》2009年12月25日報道)
引申而言,當一種生物因為遭囚禁而引起外人討論,牠不再是自己。從這個角度去看,被囚的17隻老鼠不再是老鼠(因我們談論牠們),因此答案為 (b)。

梁的思想非常深湛,對世情亦有多角度的理解,因此學生不應只滿足於以上答案,要探討其他可能。梁美芬師承內地著名「護法」蕭蔚雲,對本地法律,常有跨學科的精闢見解,例如她的「替補機制」(replacement mechanism) 理論,就是後現代政治經濟學 (post-modern political economy) 當中最為重要的理論。替補機制原本指議會議員若以「先辭職,後參加補選」的方式搞變相公投,浪費公帑的話,政治上可定義為「玩嘢」 (wányě),此時政府應該修改選舉規則,由落選但擁有最大票數餘額的議員替補空缺。後來政治經濟學者由此發展出一套理論,其中心思想,乃指「若xx出缺,由yy自動替補為經濟上最優方式」形式的命題往往都成立。依此推論,當M區有老鼠被囚,經濟學的無形之手會驅使當區的老鼠自行生育,或令其他區份的老鼠越區覓食,從而自動替補被捕老鼠的空缺,因此答案為 (c)。

可是梁的思想多樣性不盡於此。前面提過梁美芬的哲學思想,梁於哲學方面最有貢獻的範疇,是本體論 (ontology)。本體論所研究的其中一個主要問題,是「我是誰/甚麼」(who/what am I),例如在「莊周夢蝶」當中,莊子所問的,就是到底自己是夢到莊子的蝴蝶,還是夢到蝴蝶的莊子。人稱「現代哲學之父」,有名言「我思故我在」(I think, therefore I am) 的十七世紀著名法國哲學及數學家笛卡兒 (René Descartes, 1596—1650) 亦提出過身心二元論 (mind-body dualism),去研究「我是甚麼」。

梁美芬之前的哲學家,一般都只是抽象地表徵 (characterize)「我」的本質,而梁的本體論最創新和突破的地方共有兩點。第一是她提供了一個實證 (empirical) 和可觀察 (observable) 的界限(被囚惹來公論),當物體跨過這條界線,它就不再是自己,而是進入了另一個層次,這是以有形 (physical) 方式檢驗形而上 (metaphysical) 的轉變的創舉。第二,梁除了從形而上的角度切入問題,還和他人合作,從有形與普及哲學 (popular philosophy) 的角度,刺激人們以具體例子思考同一問題。她參與過的行為心理學 (behavioural psychology) 實驗當中,最著名的莫過於在2011年7月14日所進行的那一個。之前一日,她設於石硤尾與紅磡的兩個議員辦公室,均遭不明人士潑油漆。翌日,梁美芬在立法會門外即獲十多名市民表示支持,他們拉起寫有「梁美芬議員我們支持您到底」字樣的橫額,向梁獻花。然而後來從梁美芬上載至互聯網的照片可見,該批支持者幾乎個個都以紙遮面,彷彿是專為藝人造勢的臨時演員,其中一人更被認出是電影《機動部隊—伙伴》的配角。到底「支持者」是否「支持者」,自稱支持者的人職業為演員,會令人們對「支持者」的本體 (being) 的認知 (perception) 有何影響 ── 或者更簡單來說,「甚麼是支持者」(what is a supporter) ── 本來是一般人不會討論的哲學問題,可是梁美芬為了推廣哲學,親身參與實驗激起大眾討論,令此事成為哲學界的美談。

鑑於有此先例,鼠籠中的十七隻老鼠,可能只是從其他區份來的臨時演員,而非真正捕捉所得。因此,前述問題的答案,也可以是 (d)。由於國民教育要求學生從多元多角的方式理解及分析問題,在 (a)-(d) 均合理的情況之下,我們不應排拒當中任何一個,因此最合適的解答為 (e)。

2011年7月13日星期三

通告:垃圾留言

剛剛發現,原來 blogger.com 不知從何時開始,悄悄增加了一項「垃圾留言」功能。我打開「垃圾留言」版面一看,卻發現所有留言均非垃圾,似乎 blogger.com 的 spam filter 大有改進的餘地。若閣下先前的留言不知所終,原因大概就在於這個 spam filter,而在下亦謹此致歉。各項遭錯誤歸類的留言,若有重複或歷時太久,唯有刪除,其他均已歸位,本人亦即將回覆,謝謝。

2011年7月8日星期五

Schrödinger's Jiang

將仍在接駁呼吸機,但腦幹已經停止運作的 J 同志放進一個稱為「封閉政治」的房間裏,然後將呼吸機的開關連接到政治局常委會議室。設想政治局常委在一星期內有50%可能作出決定,停止呼吸機,送 J 去見馬克思。根據天朝鬥爭力學,實驗者未觀察時,常委會處於未決定和已決定的疊加狀態,但是,如果一星期後把房門打開,實驗者只能看到「已作決定的政治局常委和死 J」或者「未作決定的政治局常委和活 J」兩種情況。

現在的問題是:這個系統從甚麼時候開始不再處於兩種不同狀態的疊加狀態而成為其中一種?在打開房門觀察以前,這個 J 是死了還是活着抑或半死半活?這個實驗的原意是想說明,如果不能對政治衝擊波函數塌縮以及對這個 J 所處的狀態給一個合理解釋的話,天朝鬥爭力學本身是不完備的。

伸延閱讀:Schrödinger's cat / 薛定諤的貓

遊行人數不易估

上週抱恙,未能遊行,只看新聞。報載港大兩調查隊伍 ── 社工及社會行政學系教授葉兆輝的小組及由鍾庭耀主持的港大民意研究計劃 (POP) 所派小組 ── 分別估計遊行人數為 64000 與 58000。遊行人數,五萬又好,五十萬也好,都是很多。建制派出錢出力,年年舉辦各種「慶回歸」活動,也湊不足幾萬人參加。街上有數以萬計的庶民肯犧牲一日假期,無償地冒着酷暑上街示威。究竟市民多數為「回歸」而高興抑或為政局而憤怒,大家心知肚明。討論遊行人數是五萬抑或五十萬,就好像討論當年六四,共產黨有無在天安門廣場(而非週邊)殺人一樣,雖有學術價值,但對於瞭解大局而言,只是旁枝末節。

不過當奴上台以後,政治急劇敗壞,所以說上週只得五、六萬人遊行,就有些令人意外,亦令我想起 2004 年的爭議。自從 03 年五十萬人上街之後,七一遊行變得全城囑目。翌年七一,主辦的「民間人權陣線」(民陣)聲稱有 53 萬人上街,但憑多方學者估計,遊行人數應介乎十一萬至廿一萬之間,與民陣的估計天差地遠,引起激辯。今年遊行人數公認自 05 年以來最多,數目再成為話題。民陣聲言有廿一萬人,與前述兩港大隊伍估計的六萬四及五萬八,再次呈現巨大落差,亦令我想知道今年及 04 年各方對七一遊行人數估計的細節

2004 年大學聯隊與今年 POP 的統計方法
(資料來源:#1, #2, #3, #4, #5
2004 年的七一,有多個研究隊伍調查遊行人數,其中一隊由港大、理大及中大學者組成。港大的鍾庭耀當年也在聯隊之中,而拿當年聯隊的調查方法與今年 POP 的調查方法相比,基本上並無二致。以今年為例,簡單來說,隊伍先在遊行路線中,軒尼詩道與軍器廠街交界的天橋上設置監察點(下圖),佈置人員及攝錄機:

圖片來源:港大民意調查計劃
今年警方開放圖中 1, 2, 3 三條行車線供遊行用,而 POP 就以一人監視一條行車線的方式,用手動點算器 (hand tally counter) 點算通過天橋下方的人數。每五分鐘時段,只點算頭三分鐘,餘下兩分鐘的人數,就用前三分鐘數字按比例推出。各時段及各路線的人數總和,就是經過天橋底的總人數。當年聯隊的做法也一樣,只是那時警方曾一度開放所有行車線,而聯隊每五分鐘只點算頭一分鐘。


檢視較大的地圖

由於遊行人士可能提早離開,或者在大隊經過天橋後才加入,所以未必經過監察點。為求行文方便,姑且稱這類人為「未監察人士」,而他們佔遊行人數的比例為「未監察比例」。當年聯隊於遊行結束之後,嘗試用問卷找出未監察比例,他們以隨機抽樣電話訪問形式,成功訪問了 3512 位年滿十八歲的巿民,平均回應率是 63.8%,其中 231 位聲稱曾參與七一遊行。他們回答了下列問題:你遊行時有沒有經過軒尼詩道與軍器廠街交界的行人天橋,從灣仔進入金鐘地段?結果 231 人當中有 77.4% 回答有經過該天橋底。由於聯隊從人手點算估計出有 149,057 名受監察人士,所以推斷總遊行人數為 149,057 × 100 / 77.4 ≈ 193,000。

調查結果發表之後,其電話訪問程序受到批評,譬如《東南西北》的宋以朗先生就認為有以下缺點:
  1. 聯隊假設了回應問卷者與拒絕受訪者的統計特徵沒有分別。
  2. 由於受訪者須年滿十八歲(很奇怪的要求),他們其實亦假設了 18 歲以下及以上的遊行人士有同一統計特徵。
  3. 3512 位回應者之中,竟然有 231 說有參加。由於當年香港居民之中,約 5,500,000 位為十八歲或以上,因此按問卷結果的比例計,應該有 5,500,000 x 231 / 3512 = 362,000 人遊行,明顯與聯隊估計的 193,000 人不符。這顯示了當年遊行氣氛熱烈,許多沒有遊行的受訪者也謊稱有去遊行。
當年聯隊的報告表示他們本身是完全清楚有上述局限的。上面以最後一點比較嚴重,但聯隊認為謊報者的答案應該沒有方向性(即不會特別傾向回答「有經過」或「無經過」)。

我的想法略為不同。一般人未必會想到「你遊行時有沒有經過軒尼詩道與軍器廠街交界的行人天橋,從灣仔進入金鐘地段」這道問題有何微言大義,既然謊稱有遊行,應該也會回答「有經過」。換言之,即使有人說謊,相信只會拉低未監察比例,從而拉低總遊行人數,所以聯隊根據問卷結果而對遊行人數作出向上修正,我相信應該是有效的,只是修正的幅度未必足夠。

今年 POP 依然以抽樣電話訪問來找出未監察比例,但尚未完成電話訪問,因而暫用去年未監察比例為 30% 這個數字作推算。他們亦無說明會否(或能否)改善問卷設計,減輕謊報的影響。以前有些家訪的問卷,含有敏感問題,於是調查員會讓受訪者抽暗籤,於敏感問題及某條人畜無害的問題之中二擇其一。由於調查員不知受訪者抽到那一條問題,因此受訪者可以放心回答。也許 POP 可以用類似方式應付謊報者。例如,與其問受訪者有無參加七一遊行,可不可以將問卷設計成下面這樣?
(A) 以下我會問兩條問題,若貴戶的成員數目為單數,請回答問題一,若是雙數則回答問題二。請勿告訴我你回答那條問題,只須回答「有」或「無」即可。
  1. 政府現正建議一套機制,當有立法會議員出缺時不再舉行補選,而是由換屆選舉落敗候選人其中之一補上。請問你於訪問前有無聽過這個替補機制?
  2. 你有無參加今年的七一遊行?
若受訪者回答「有」,再問下列問題,否則結束訪問。

(B) 以下我會再問兩條問題,若閣下剛才回答問題一,請繼續回答以下的問題一;若剛才回答問題二,請回答以下的問題二。請勿告訴我你回答那條問題,只須回答「有」或「無」即可。
  1. 去年(5月16日)立法會五區補選中你有無投票?
  2. 你遊行時有無經過軒尼詩道與軍器廠街交界的行人天橋,從灣仔進入金鐘地段?
由於調查者不知受訪者回答那一條問題,因此受訪者會少了說謊的誘因。此外,全港住戶成員數為單數的比率可從統計處獲得,問題 (A1) 及 (B1) 中回答「有」或「無」的比例也是已知(註:為求方便,此處假設回答 A1 與回答 B1 並不相關,否則,應選擇不相關的問題或已知答案的 joint distribution 的問題來問),因此從問卷答案的統計,可計算出問題 (A2) 及 (B2) 中回答「有」或「無」的比率。對於問卷設計,我並不在行,不知上述方法實際是否可行,或有無其他解決辦法,還望有識之士不吝賜教。

葉兆輝的統計方法
(參考資料:#1, #2, #3
港大的葉兆輝於 2004 年及今年均有組織獨立隊伍調查遊行人數。葉本身的統計素養很高,但奇怪的是,他似乎從來都沒有像 POP 般在網站詳述調查方法。從當年報章及今年《星島日報》與《明報》報道來看,他的隊伍是每五分鐘點算頭一分鐘,方法與 POP 十分相似,只有兩點顯著分別:
  1. 葉除了於軍器廠街之外,還於波斯富街設置監察點(04年兩個監察點分別位於銅鑼灣電業城附近及金鐘太古廣場附近天橋)。
  2. 葉並非以電話訪問,而是在第二個監察點附近隨機訪問遊行者是否在第一個監察點以後才加入。假設於第一個監察點以後才加入遊行的受訪者比例為 p,而在第一監察點點算到的遊行人數為 m,在第二監察點點算到的遊行人數為 n,那麼葉就將總遊行人數推論為 m+np。
葉兆輝自己曾明確表示,他的辦法會先天地漏數 (a) 在第一監察點之前離開,(b) 在兩個監察點之間加入及離開,以及 (c) 在第二個監察點之後才加入的人。

如何界定「遊行人士」,人言人殊,但只要遭定義排除的遊行者數目不多,不把他們納入計算也影響不大。2004 年兩個監察點位於銅鑼灣電業城及太古廣場附近,較接近遊行路線的起末兩端,因此 (a), (c) 兩部份可以不理,但 (b) 部份可能有很大偏差。今年兩個監察點位於遊行路線太約三分一及三分二之處,(b) 部份的誤差仍可能顯著,但相信還不致於將民陣聲稱的廿二萬人低估成六、七萬人這麼離譜。

宋以朗先生當年於網誌中認為,大學聯隊所用方法不及葉兆輝的那麼好。就估計未監察比例而言,我也同意 ── 若聯隊可以用較複雜的問卷來消除謊報者的影響,要計算未監察比例的統計誤差就可能反過來變得複雜,不及葉的設計乾淨。然而,葉的調查本身亦有可議之處。用他的方法,遊行人士同樣可能謊稱自己沒有經過第一監察點,從而拉高未監察比例。更重要的,是葉並無詳細披露統計方法,有些細節付諸闕如。例如 2004 年那次,據《星島日報》所載(宋以朗譯):"At each counting station, three workers independently counted the number of marchers for the entire march period."何謂「獨立地點算」?是每人都負責所有行車線,然後取平均值?抑或如聯隊般一人負責一條線?他們當年「發現平均每分鐘最高流量達六百人次」(《星島》報道),亦即每秒十人,要是各人皆負責所有行車線,除非是神級的點算員,否則很難不出錯。

報章又說,按人手點算及現場抽樣訪問,前述的 m=125,000, n=110,000, p=0.23,所以 m+np ≈ 150,000。然而,考慮到漏數了前述 (a), (b), (c) 三項,葉最後決定將總人數再加 10%,變成 165,000。這 10% 如何「估」出來,《星島》沒說,其他報章也沒說。更神奇的,是添加了這麼一個來路不明的 10% 之後,葉兆輝竟然可以估計到 margin of error 為 25,000 人。當年聯隊的抽樣電話訪問縱有瑕疵,但每個數字均有來歷。相比之下,葉兆輝的調查也許準確,也許不然,但他沒有披露足夠細節,又似乎加入了好些人為因素,我覺得似魔法多於嚴謹的統計。葉兆輝是本地敢言的學者之中統計素養極高的一位,但科學討論講究證據,若其研究不夠透明,我認為報章不應將他的結果視作可靠。

一些誤差
綜觀以上兩種方法,均有一些瑕疵:
  1. 同時經過天橋底的人數會否太多,令調查員不及點算。
  2. 走在行人路上的遊行者會否遭忽略。
  3. 沒有經過監察點(天橋底)的遊行者會否遭忽略。
  4. 走在兩條行車線交界處的人會否遭重複點算或忽略。
  5. 同理,在每個作點算的時窗開始或終結時,正在越過天橋底的人士,究竟應否點算。
第一點會令遊行人數被低估。當年聯隊及今年 POP 均由一位調查員負責點算一條行車線,按聯隊 04 年的統計結果,最高峰的 30 分鐘約有 5320 人通過天橋底的其中一條行車線,即平均每秒 2.95 人。平均數只是一個中間數字,實際上應該有一秒內有超過三人通過監察點的情況。在此情況下,調查員會否漏數人頭,值得懷疑。今年的調查數字指最高峰的 20 分鐘約有 1882 人通過天橋底的其中一條行車線,或每秒 1.57 人,相信漏數的程度較低,但仍不改高峰時可能低估遊行人數這個事實。葉兆輝的隊伍也是用人手現場點算人數,所以亦有此毛病。

第二點同樣令數字被低估。今年我無遊行,不知警方有無用鐵馬攔着監察點附近的行人路,若無的話,POP 的方法會數漏人頭。葉兆輝並無詳述其方法,不知有無中招。這種誤差很難避免。始終,何謂遊行人士,並無清楚定義。若有人沿着遊行方向在行人路上走,點算者那知道他是遊行人士還是普通行人?(反過來說,行人也可能走進遊行人士之中,但此情況應該罕有。)當然,以軍器廠街天橋底的情況來說,若有人從行人路繞過天橋並向遊行方向繼續走,應該是遊行人士無疑。要留意,除非調查隊伍事先充份宣傳各監察點的位置,否則這方面的誤差很難用問卷調查修正,原因是遊行者只會記得自己通過了監察點,但未必記得當時自己是從天橋下通過抑或從行人路繞過天橋。總之,很難責怪學者沒有顧及這方面。

第三點之前已討論過,它是上述各項當中最嚴重者,不過今年兩個調查隊均有考慮這點,相信不會引起大問題。順帶一提,04 年港大社會科學研究中心主任白景崇也調查過遊行人數(見 ESWN 摘錄), 方法是在金鐘天橋設置攝錄機,事後用人手點算錄影片段中的遊行人數,每三十秒點算頭四秒,再按比例推算出總人數。白景崇並無修正第三點所造成的誤差,以致結果嚴重偏低,不過他原本的目的並非要準確估計遊行人數,而是提供一種方法去驗證人手點算是否可靠。他的方法也沒有上述第一、二、四項毛病,有懷疑的時候也可重新點算。理論上,POP 及葉兆輝也可以並應該以從錄影片段的點算結果為本。他們取 hand tally 而棄錄影帶,相信是為了儘快向傳媒公佈統計數字。

第四、五兩點是雙向偏差。若負責相鄰路線的點算員均把走在行車線交界的人當作自己線上的遊行者,就會高估了數字;反之,若大家都剔除這類人不算,就會低估了人數。POP 的方法即有此毛病,葉兆輝並無詳述其方法,但相信屬同一套路。只要抽樣比較現場點算結果與從錄影片段中點算結果,這方面的誤差很容易修正,然而 POP 及葉兆輝均無解釋他們有否採取適當措施,不過這方面的誤差,相信極微。

整體來說,POP 及葉兆輝的方法均傾向低估遊行人數,但實際低估了多少,我無充份資料,難以判斷,不過我相信今年上述五項因素造成,而又未曾應付的誤差並不大。真正有問題的,反而是抽樣方法本身。

抽樣方法的問題
大學聯隊、POP、葉兆輝或白景崇,都是每某 m 分鐘點算頭 n 分鐘。電子工程佬稱此為 uniform sampling。從統計角度去看,採用 uniform sampling 是一種很奇怪的 practice,最低限度也應該使用 systematic sampling。Uniform sampling 與 systematic sampling 的分別,在於第一個時段如何點算。以聯隊的做法為例,他們每五分鐘點算頭一分鐘。若是 systematic sampling 的話,應該從首五分鐘的時段隨機選擇其中一分鐘來點算,然後從該時點起,固定地每隔五分鐘取一次樣本。這樣,才可以令整個遊行中每一分鐘也有可能成為樣本。聯隊的做法,會令每五分鐘時段的後四分鐘不可能成為樣本。

此外,uniform sampling 與 systematic sampling,均有對週期性資料存在極大潛在偏差的弊病。舉個例,若人流以如下的波狀到達:
圖中人流以五分鐘為一週期,而每週期有 13+10+9+20+18 = 70 人通過,或每分鐘 14 人。若按 POP 的取樣方法,每五分鐘點算頭三分鐘,就會永遠碰着週期之中人流最低的三分鐘,令結果變成每三分鐘 13+10+9 = 32 人,或每分鐘 10.67 人,比正確數字低估了足足 24%。諷刺的是,若按聯隊的方法,每五分鐘取頭一分鐘,結果將成每分鐘 13 人,與正確答案只差一人。樣本較少反而較準確,但這只是死好命,不是可以依靠的辦法。

現實中的一波波人潮,當然不是那麼有規律,但是人流總有疏密變化,而我們不知道它有無局部的週期性。更重要的,是當我們使用 uniform/systematic sampling 的時候,無法預知究竟抽樣頻率與人潮頻率比較,是高是低。電子工程佬也有類似概念。 舉例說,若對某電波每隔一秒抽樣,發現其波幅乃下圖各黑點所代表的數值:
圖片來源:維基百科

他們發現,若要從離散的樣本數值重構整個波形(例如利用離散傅立葉變換),往往只會構作出較低頻的周波(本例中為圖中藍線),不能還原高周波(圖中紅線)。要準確還原波形,別無他法,只能用更高抽樣頻率。抽樣頻率愈高愈好,看似是「阿媽是女人」之類的廢話,但訊息處理 (signal processing) 理論其實說得更具體 ── 抽樣的頻率應該最少兩倍於所觀察的周波的最高頻率,方才可靠。電子工程佬稱此為 oversampling

Simple random sampling and stratified sampling
遊行者以群落方式波狀推進(明報圖片)
若將 uniform/systematic sampling 換成簡單隨機抽樣又如何?從整個遊行分為一個個只得一分鐘的小段落,然後在眾多小段落中隨機抽取五分之三來點算,會不會較每五分鐘點算頭三分鐘好?

簡單隨機抽樣,可以避免人流的局部週期性帶來的影響,但是它也帶來新問題。歷年的七一遊行,都是以中間時段為高峰,較早的時段次之,遊行將結束時流量最少。若隨機抽樣,萬一樣本集中在前後兩段,或集中於中間時段,就會「一鑊熟」。

較四平八穩的做法,是用 stratified sampling。用聯隊的例子來描述的話,我們仍可以五分鐘作一時段,但每個時段內到底點算那一分鐘,則隨機決定。這種做法較少受到宏觀或微觀的人流起伏影響,比較穩陣。

讀者可能會問,各學者為何不採取這種抽樣方法?其中一個可能答案,是為了執行上的權宜。每條行車線及每個時段隨機選擇一分鐘,製成點算時間表,這可以事先做,但臨場通知每位點算員按時點算,要較多協調功夫,也容易出錯。人手有限之下,簡單的抽樣方法比較吸引。

幾分鐘的起伏
說甚麼局部的週期性,也許扯得太遠,事實上我也沒有證據顯示人潮的局部週期性真的對 uniform sampling 構成大影響,所以讀者不妨當我沒說過,忘記那些甚麼周波東東的廢噏。

但就算不考慮這個因素,各學者的統計方法,如電鋸所言,仍忽略了最基本的 sampling error。撇開細眉細眼的數目不談,各學者基本上是這樣估計出遊行人數:
  1. 用 uniform sampling 數人頭,每某 N 分鐘點算頭 n 分鐘。
  2. 將整個 N 分鐘時段的人數,按比例當成 #1 點算結果的 N/n 倍。
  3. 在現場或事後用電話,抽樣訪問,找出未監察比例。
  4. 將 #2 的結果除以已監察比例,就是總遊行人數。
問題就出在 #2。每 N 分鐘點算頭 n 分鐘,再按比例乘出整個時段的人流,背後其實假設了餘下 N-n 分鐘的每分鐘流量與頭 n 分鐘無大分別。然而,若人流於後 N-n 分鐘經歷大變化,那麼各學者的統計方法就會出現很大問題。

短短幾分鐘之內的人流量,可以有多大變化?直覺上,人多的時候,大家的活動空間有限,遊行隊伍的密度縱有起伏,也只是逐漸變化。用高中數學術語來說,人流的時間曲線比較平滑,用前三分鐘的人流按比例算出後兩分鐘的人流,就好像用 retangular rule 或 trapezoidal rule 來計算定積分,方法儘管粗糙,但準確度應該令人滿意?

前面提到白景崇從錄影帶點算,目的是驗證其他隊伍人手點算的準確性。他每卅秒點算頭四秒,結果發現當年通過金鐘天橋的總人數為 112,000 人,與葉兆輝用人手點算得出的 110,000 人,只有二千人次的差距。驟眼看來,這似乎顯示結合上述 #1 與 #2 的結果會相當準確,但參照當年聯隊的報告,又似乎不是這樣:
讀者或許已注意到,不單按人流密度的多個遊行人數推算存在著很大差異,即使在相近地方作直接點算的遊行人數亦有很大差異。舉例說,本研究隊在軍器廠街天橋接近金鐘的點算站共錄得十四萬九千名遊行人士經過,而葉兆輝領導的另一支研究隊在金鐘太古廣場附近的天橋卻點算得十一萬人,兩個點算站相距不遠,但人數卻相差了四萬人。同樣地,葉兆輝領導的研究隊在銅鑼灣電業城點算到十二萬遊行人士,而《星島日報》刊載的大埔專上學生同盟研究隊,亦於銅鑼灣作點算,他們採用每十五分鐘拍攝一分鐘人流,然後投影及點算人流的方法,點算到途經該點算站的遊行人數為九萬人,兩者之間亦相距了三萬人。若非點算不準確,則中途加入或離開的遊行人數確實不少!
當年聯隊的報告還可以將差異歸因於兩隊的不同監察點之間有人中途加入或離開,但今年七一,兩隊均在同一地點(軍器廠街天橋)設置監察點。按時間比例得出上述 #2 的結果之後,你猜他們估計有多少人通過監察點?

答案:POP ── 41,019 人;葉兆輝 ── 約 51,000 人,兩者相差 24%!

POP 是每五分鐘點算頭三分鐘,葉兆輝則點算一分鐘。除非其中一方人手點算 (即 #1) 出現很大錯誤,否則就是 #2 出問題,人流可以於五分鐘內有巨大起伏。

如何估計這方面的誤差?若沿用 uniform sampling 的話,是無能為力的。例如每五分鐘點算頭一分鐘,由於是固定樣本,頭一分鐘無代表性。用它來推斷其餘四分鐘的數字,我們不單不知道 margin of error,就連統計結果本身向那個方向偏差也不知道。儘管今年 POP 與葉兆輝也有公佈他們所謂的「統計誤差」(POP: interval estimate = 54,000─64,000; Yip: 60,000─70,000),但 POP 指的誤差是因計算未監察比例 (#3) 所引至的部份,而葉兆輝則一貫神奇地不知從何處得出誤差的大小。

如何估計遊行人數
要避免 uniform sampling 的弊病,最好還是從根本改善抽樣方法。用 simple random sampling 或 stratified sampling,均可得到 unbiased estimators。由於隨機抽樣,每一分鐘也有機會成為樣本,因此每個樣本也有代表性,可以用來計算統計誤差。

實作的話,應該用 stratified sampling 而不是 simple random sampling。兩者都是隨機抽樣,implementation 的難度相若,但 stratified sampling 可以控制取樣頻率,而且它理論上的誤差遠比 simple random sampling 低(若兩者皆有 n 個樣本,而前者有 n 個同樣大的 strata,每個 stratum 一個樣本,則前者的誤差只是後者的 1/sqrt(n) 倍)。

舉例說,調查隊可以三分鐘作一時段,每時段均隨機選擇一分鐘,讓各路線的負責人同時點算(亦即各路線並非各自隨機選擇點算時間)。每三分鐘揀一分鐘來點算,亦即是兩次點算之間最多有四分鐘空檔,與葉兆輝或當年聯隊每五分鐘點算一分鐘所產生的空檔相若,每人亦最多連續點算兩分鐘,比 POP 的連續點算三分鐘短,隊員有較多時間休息。此外,取樣率是 1/3,比聯隊或葉兆輝的 1/5 高,但比 POP 的 3/5 低,調查隊伍的人力應該應付得來。各路線皆在同一分鐘點算,協調上也較方便。

從這種取樣方法估計出總遊行人數及其誤差,其實就是 Monte Carlo method,這些一般講 simulation 或 numerical integration 的大學教科書都有教,甚至列出公式,故此處不贅。

2011年7月7日星期四

《告全黨全軍全國各族人民書》

天朝秘不發喪,總令我覺得好像是二流動畫的橋段,說不定某一日從電視上會看到 J 同志向我們問好:
J 同志是我黨我軍我國各族人民敬愛的領導人,偉大的馬克思主義者,偉大的無產階級革命家、政治家、軍事家,久經考驗的共產主義戰士,「三個代表」理論的創立者。近日有流言指 J 同志病重垂危,甚至過身,這些都是由一小撮勾結外國勢力,別有用心的反動分子妄圖推翻由天朝共產黨領導的人民政府的詭計,企圖矇騙不明真相的群眾。我黨嚴正聲明,J 同志並未過世,而是進入了具天朝特色社會主義喪屍的初級階段,加入由我黨我軍我國各族人民公認的偉大領導人、國際無產階級和被壓迫民族被壓迫人民的偉大導師 M 主席與我國社會主義改革開放和現代化建設的總設計師 D 同志的行列,成為我黨我軍我國各族人民永遠的領導人,堅定不移地為人民和為建設社會主義天朝永遠服務。現在由 J 同志向大家發表重要講話:

(鏡頭一轉,J 同志以僵硬的神情和動作向鏡頭揮手)

同志們好…同志們…辛~苦~了…

伸延閱讀:「李祘(算)把啦!」;《聞.見.思.錄》

2011年6月20日星期一

Long time no see


昨晚的新聞節目《星期日檔案》論港式英語,大意是港人英語能力日趨下降,快要給大陸學生超越云云。節目的題旨不錯,但扯到內地就很無聊。就算內地人的英語愈來愈好,威脅到香港這個貿易城市的地位,難道港人就會因而更易學英語?

港人學英語,主要有兩個問題。第一是沒有一個應用英語的環境。這是香港自身的難處,與其他地方無尤。在這個九成半以上人口都說粵語的社會,要為學生尋找一個運用英語的環境,非常艱難,不過互聯網的興起,也許能打開一個缺口,例如學生可以到外國的討論區或網誌留言,實戰應該比單方面的閱讀或練習更有效。

另一個問題,是香港人有一種反智的風氣。特別在年輕人當中,認真想說好英語的,反而會給朋輩視為造作,甚至排擠。例如 "game",幾乎所有小學生都學過它的正確讀法 (/geɪm/),但人們偏偏明知故犯,將它讀成 "gam" (/gæm/),尤其是電視廣告及綜藝節目,更助長了這種歪風。每次聽到別人說 "gam",我就想窩佢兩搥。

至於節目中嘉賓說 "long time no see" 是港式英語,則顯示了各「專家」的無知。首先,未有確鑿證據顯示 "long time no see" 一語出自華人社會(遑論香港)。此語暫首見於 William F. Drannan (1832-1913) 所著小說 Thirty-One Years on the Plains and in the Mountains (1900),書中有 "long time no eat much" (p.571) 及 "long time no see you" (p.581) 兩句,卻是從印第安人口中說出。不少其他二十世紀初的小說或散文當中,提及類似句式的時候,也沒有談及華人。例如:
  • Edmund James Banfield (1852-1923) 的 The confessions of a beachcomber (1906, ch.5, p.239),就由阿拉伯人 Hassan 說 "I no see you long time."
  • Philip Ashton Rollins (1869-1950) 所著 The Cowboy: An Unconventional History of Civilization on the Old-time Cattle Range (1922, p.78),談及西部的 pidgin English 時,就提到
    Pidgin-English contributed its quota of words and phrases. Its "long time no see 'em" conveniently set forth the status of a searcher for some lost object, while its "no can do" definitely expressed personal impotence.
    作者並沒說此語於那個族群流行。書中緊接著談的是印第安族群 Chinook 的英語,而且整章亦未提起過華人。
其次,"long time no see" 應該視為 pidgin English 而非港式英語 (Chinglish)。雖然 Chinglish 和 pidgin English 都是為了將就英語以外的其他語言,歪曲了原有英語語法或詞義而產生的另類英語,但 Chinglish 指的是只在華人社會流行,而外人一般都不明白的異化英語。當 Chinglish 的運用變得普及,連一般 native English speakers 都明白,就應該稱為 pidgin English。

換句話說,Pidgin English 就好像英語中的法語外來詞一樣,都是日常英語的一部份。民初的書籍將 pidgin English 譯成「洋涇濱」英語,現在大陸則稱之為「皮欽英語」,兩種譯法都譯不出詞語的意義。依我看,將 pidgin 譯成「皮諺」(與原有語法只有皮毛相似的俗語)也許更能兼顧音義兩者。

儘管 pidgin English 難登大雅之堂,但地位與 Chinglish 不可同日而語。留意 pidgin English 未必都源自華人,例如 all your base are belong to us,就是從日本製作的電子遊戲而來。教曉學生說正規英語 (such as "I haven't seen you for a long time" instead of "long time no see") 固然是好,但矯枉過正,就會失去了一些文化趣味。

2011年6月14日星期二

費正清:人生的悠長假期

George B. Glover (吉羅福) was an American who served as a diplomat and also a commissioner in the Imperial Chinese Maritime Customs Service (大清國海關稅務司) during the late nineteenth century. To Mahjong historians, he is well known for what he donated to the American Museum of Natural History in 1875 ── the first ever recorded Mahjong set in history. According to the American Numismatic Society, his collection of "Far Eastern" numismatic items was also donated to the museum after his death by his widow, Lucy H. Glover.

The following is quoted from Fairbank, J.K., Bruner, K.F., and Matheson, E.M. (ed.), The I. G. in Peking: Letters of Robert Hart, Chinese Maritime Customs, 1868-1907, Belknap Press of Harvard University Press, 1975, p.690:
George B. Glover had gone on leave from 1885 to 1887 and did not return to the Customs Service.
From Barney Genealogical Record, Nantucket Historical Association:
     George B. Glover was also known as George H. The "H" was crossed out and "B" written in. He was born on 8 July 1827. He married Lucy Happer, daughter of Andrew Happer, in 1870 at China. George B. Glover died on 4 October 1885 at age 58.

2011年6月11日星期六

驚蟄記

並非驚蟄日,而是恐蟲記。今日閒賦在家,赫然發現廚房洗碗盤附近的彈性水泥出現缺口,兼有一羣懷疑是白蟻的蟲子爬來爬去。大驚之下,立刻上網找滅蟲公司的資料,再打電話問價。身為 cheap 精,平日凡事拖得就拖,Computer Programming 101 都有教啦,premature optimization is the root of all evil 嘛!只有兩類事情不能拖,家人有大病是其一,而另一樣就是白蟻。

翻看了幾間本地滅蟲公司的資料,發現他們有些只服務機構顧客,大概生意好到「唔憂米」。最後選了兩間公司問價。致電 A 公司,接線生回覆負責人去了吃午飯,着我留姓名、電話。再電 B 公司,接聽者聽我說了情況之後,第一件事就問:
你說的白蟻,有幾大?
我回答最多 1mm 左右。對方再次確認:「即是原子筆的一點點那麼大?」我答:「係。」他立刻說,那不是白蟻啦,白蟻應該最少有三分之二粒白米那麼長。我一時愕然,只懂得說原來如此及謝謝,對方二話不說,隨即收線。可能他見慣我這類「搞搞震無幫襯」的 termite-phobic,才懶於應酬吧,不過我倒沒有感到不快,反而為對方有最基本的專業操守而覺得高興。

之後到 A 公司回電,對答與上述類似。對方說,若是白蟻,應該約莫有白米那麼大,附近也有泥漬。比芝麻細小的,應該是蟎蟲,它們專從潮濕地方繁殖,滅蟲可以改善一時,但由於是環境因素產生,日後仍會再出現,不過若我需要的話,可以做一次全屋防治,殺滅蟎蟲之餘還可以預防其他某些蟲害。收費則盛惠七百,聽起來不錯,可惜我是 cheap 精,唯有滿懷感激和歉意地說會考慮一下,然後 sayonara。

2011年6月4日星期六

想起張學良

對張學良來說,每年六月的三、四兩日,都是特別日子。六月三日是他的生日,而六月四日乃其父親張作霖的死忌。

殺死張作霖的,是日寇;六十一年後為了鎮壓民主運動而殺死數以千計國人的,是共匪。張學良「獲釋」移居美國之後,有一次,劉賓雁、李勇及曹長青等人上門拜訪,席間李勇提到在中共治下中國人喪生數量遠超過抗日戰爭時,張學良竟然回答「哪個政府為維持政權總是要殺些人的」,而當曹長青提起六四事件,張學良則說「電視我沒看,對這事不太清楚。……甚麼事不能只聽一方的。」(見盛禹九憶述劉賓雁的談話曹長青的敘述。)人這種動物,大概還是感性先於理性吧。張學良戒懼國民黨可以理解,但如此為共產黨幫腔,卻是盲目了。抑或是我搞錯 ── 其實張學良頗有來香港做「建制派」的天份?

當年張學良發動西安事變,遭蘇共《真理報》嚴厲批評,認為反蔣不利抗日。若事件沒有發生,蔣介石能夠順利「先安內後攘外」的話,不知如今又是甚麼景況?可惜歷史並非自然科學,無法嚴謹推論,更無法作比較實驗。思考一下是不錯,沉迷妄想就無謂了。

2011年6月2日星期四

Endeavour & Buran

俄羅斯早於 1993 年擱置她的 Buran 太空梭計劃。昨日,美國的奮進號亦完成了最後一次太空任務,降回地面,太空穿梭機的年代於焉告終。

奮進號的最後任務:將物資送上國際太空站 (source: NASA)


前蘇聯製造的太空梭 Buran (source: World of Mysteries)

後記 (2011-07-08):我弄錯了,原來 NASA 爭取到 budget 進行多一次穿梭機任務。Endeavour 退役後,於香港時間7月8日晚升空的 Atlantis,才是真的為美國太空穿梭機年代劃上句號。(Link: Watching the Historic STS-135 Launch)

2011年5月31日星期二

Thailand's Got Talent



凡事慢半拍,現在才看到。沒耐性的可跳到 1:06 開始看。重點不在於參賽者的歌,而是中途出現的 twist。有些感人。

2011年5月25日星期三

建華十五年

(摘自:沈千三著,《建華十五年》,社會大學出版社,2309年,南京。)

公元2005年,中華人民共和國香港特別行政區首任行政長官董建華,聲稱腳痛請辭。同年,本來擔任特區政務司司長的曾蔭權,宣誓成為第二任行政長官。儘管曾蔭權於行政長官補選中並無對手,乃自動當選,但董建華因身體出現小故而辭職,令特區政府平白浪費公帑舉行補選,仍令朝野嚴厲批評為「玩嘢」。於是中國第十一屆全國人大常委會第八十九次會議通過,主動對《基本法》作出解釋,日後凡行政長官出缺,除非辭職者本來自動當選,否則將由行政長官選舉中得票第二者替補。

2007年,香港特區政府進行第三次行政長官選舉。民主派立法會議員,「公民黨」的梁家傑於選舉委員會中取得足夠提名,與曾蔭權同台競爭。本來選舉委員會以親北京的成員佔大多數,所以梁家傑獲得提名,令當時的香港人相當意外。根據另一政黨「民主建港聯盟」(民建聯)的黨史,此實乃民建聯「成功爭取」的結果。多數史家鑑於民建聯大量「成功爭取」的政績,均採納這種說法,不過也有學者認為此說成疑,原因是此事只從第六十四版的民建聯黨史開始才有,之前各版均無記載。他們認為梁之獲得提名,其實是北京為了粉飾政治開明而促成,不過無論真正原因為何,最後選舉結果一如所有人的預料,是由北京支持的曾蔭權勝出。

為了推翻曾政府,當時一些屬於激進政黨「社民連」的青年,決定利用人大釋法所帶來的契機,趁曾蔭權出席「辛亥革命展」,企圖以投擲粟米班腩飯的方式將他刺殺,史稱「粟米班塊事變」,但行動以失敗告終。儘管刺客所屬政黨與梁家傑不同,亦無證據指刺殺行動乃社民連或公民黨主使,但親政府人士一口咬定,事件為「反對派」的大合謀,而媒體亦紛紛譴責恐怖活動。最後立法會通過法例,將粟米班腩飯列為受管制物品,非法管有粟米班腩飯者,最高可罰款二十萬及監禁一年。

由於粟米、班腩及白飯三種物品可以分開購買,因此日後仍發生了一連串類似的企圖暗殺事件,令警方疲於奔命,不過總算將各暗殺行動一一制止,故特區政府也習以為常。誰知,當曾蔭權的任期只剩下九個月時,發生了一件令七百萬香港人也為之驚訝的事 ── 政府宣佈,曾蔭權由於「急性前列腺劇痛」,於2011年10月2日凌晨猝逝,成為首位(痛)死於任內的特區行政長官。有關此事,民間傳聞甚多。有流言指曾蔭權起初以為可捱到任滿,但痛楚愈來愈烈,令他決心辭職休養,可是中央政府為了顧全大局,卻下達了「堅忍為國」的四字指令,使他不得離任。另有一說指曾蔭權其實卒於10月1日晚近午夜時分,但中央人民政府駐港聯絡辦公室(北京政府與特區政府之間的聯絡機構)為了避忌(10月1日為中國國慶),所以將死亡時間推遲十數分鐘,變成翌日凌晨。其他傳聞還有許多(跟花柳病或性行為有關的更是少不免),但迄今並無證據證實任何一項。

曾蔭權歿後,梁家傑依法繼任行政長官,起初的確令香港市民十分雀躍。然而梁接任時,餘下任期只剩八個月,可做的事情本已不多,加上北京政府杯葛、親北京政客所控制的議會阻撓,以及文官陽奉陰違,令梁的施政處處受制肘,不僅在中港的跨境事務上毫無進展,連在本地事務,也創下了特區史上,政府提出的法案於行政長官任期內,除了財政預算案及一些必要的撥款議案之外,完全無法獲議會通過的記錄,最終令梁家傑留下了「無能」的污名。對於此事,後世學者有不同意見。有人認為梁的不幸,在於曾蔭權死得太遲。若梁剩下的任期不是那麼短,就算是北京政府,也不敢杯葛得那樣徹底。又有人認為,若非曾蔭權時代的新聞媒體已經統統被收編,香港人也會瞭解真相,不至於認為梁缺乏施政才能。不過亦有人反駁,無論對方有多橫蠻無理,政治始終需要妥協;不懂得妥協的,怎樣也稱不上是合格的政治家。時至今日,像香港這樣的小城應如何於強權之下自處,仍令評論家爭辯不休。

2011年5月20日星期五

又六合彩

吓?史上頭獎獎金最高嘅一億元六合彩都開咗咯,你而今先來講?

無錯,本博就係慢半拍。本來無打算寫,不過睇到啡大的昃思庭先生講「大包圍」,就勾起條筋嘞。

一個好簡單嘅問題:大包圍買六合彩,可唔可以 arbitrage?

呢個問題驟睇起來好簡單,但實際上都要清清楚楚計過條數先知。

Preliminaries
六合彩買六個冧把,共有 13983816 種組合。假設各組合出現的機率相同,咁樣一注能中頭獎至七獎嘅機會為:
(∗): p = (p1, p2, p3, p4, p5, p6, p7)
           = (1, 6, 252, 630, 12915, 17220, 229600) / 13983816.
順帶一提,以上概率的總和,只有 0.0186,亦即你買一注,有錢分嘅機會(那怕係安慰獎),只有 1.86%;買一張電腦飛(四注),有錢分嘅機會,亦頂多係 [1 - (1-0.0186)4] × 100% = 7.25%。

好。而今假設你喺 last minute 先決定大包圍,13983816 種組合各買一注,又設
T = turnover = 你未下注前的投注額
N = 你未下注前的投注總注數 = T/10
t = 大包圍所需投注額
J = Jackpot = 多寶彩金
根據馬會嘅規則,分配獎金時,首先會計算四至七獎的彩金:
P4 = 9600 × 四獎中獎注數
P5 = 640 × 五獎中獎注數
P6 = 320 × 六獎中獎注數
P7 = 40 × 七獎中獎注數
假設箇班友係隨機咁買,而佢地第 i 獎嘅中獎注數為 Wi。因此
P4 = 9600 × (W4 + 630)
P5 = 640 × (W5 + 12915)
P6 = 320 × (W6 + 17220)
P7 = 40 × (W7 + 229600)
之後先至計算頭、二、三獎嘅獎金。首先,將總投注額扣走嘅 46%,用來交稅,做慈善,做行政費等等。之後扣除四至七獎的彩金。剩低嘅,再扣走 9% 做累積金多寶。於是餘額為:
A = [0.54 × (T+t) - (P4 + P5 + P6 + P7)] × 0.91.
頭、二、三獎嘅獎金係咁樣計算:
P1 = 0.45 × A + J1
P2 = 0.15 × A + J2
P3 = 0.40 × A + J3
其中 J1, J2, J3 加埋,係上期若頭/二/三獎無人中而撥入今期嘅獎金。呢筆數細部嘅金額為何,馬會並無公佈。呢度我只好簡單咁當 J1 = J(多寶獎金), J2 = J3 = 0。總括來講,你分到嘅頭獎至七獎獎金為
P'1 = (0.45 × A + J) / (W1 + 1)
P'2 = (0.15 × A) × 6 / (W2 + 6)
P'3 = (0.40 × A) × 252 / (W3 + 252)
P'4 = 9600 × 630
P'5 = 640 × 12915
P'6 = 320 × 17220
P'7 = 40 × 229600
而我地最終要計算嘅,係 E(P'1 + P'2 + P'3 + P'4 + P'5 + P'6 + P'7)。呢個其實唔係咁易計,原因係 E(P'1) 至 E(P'3) 嘅計算,會牽涉 E[Wj / (Wi + c)] 形式嘅期望值 (i ≤ 3 < j),而 Wi 又同 Wj 相關。好在(對投注者來講就唔好彩啦)各 pi ≈ 0(特別係三獎或以上),因此不妨用以下嘅 approximation:
E[Wj / (Wi + c)] ≈ E(Wj) / E(Wi + c) = (N × pj) /  (N × pi + c)

理想:得你一條友投注
昃思庭考慮嘅情況,係得你一條友投注,因此上面的 T, N 及各 Wi 都等於 0,並且對於 j≥4,有 P'j = Pj。此外,大包圍 13983816 注,動用的資金為 t = 13983816 × \$10 = \$139,838,160。故此你分得的獎金為
(P'1 + P'2 + P'3 + P'4 + P'5 + P'6 + P'7)
=  [0.54 × t - (P4 + P5 + P6 + P7)] × 0.91 + J + (P4 + P5 + P6 + P7)
=  0.4914 × t + 0.09 × (P4 + P5 + P6 + P7)] + J
因此,要回本的話,上式要等於 t,所以累積多寶獎金最少要有
J = 0.5086 × t - 0.09 × (P4 + P5 + P6 + P7) = \$68,510,968.176
今期多寶獎金有 J = \$85,618,703。如果真係得你一條友投注,兼且大包圍,咁就穩賺 \$17,107,735。

現實
今期開彩前約五分鐘(即我寫上一篇吹水文嘅時候),馬會公佈投注總額為 T = \$319,943,790(三億幾),所以 N = T/10 = 31994379。如前述,設 J1 = J,而 J2 = J3 = 0。夾夾埋埋,可以計到
P'1 ≈ 45083723
P'2 ≈ 6347879
P'3 ≈ 16927677
P'4 = 6048000
P'5 = 8265600
P'6 = 5510400
P'7 = 9184000
以上七項,總計回報為 \$97,367,278(約九千七百萬),同大包圍投注所需嘅 \$139,838,160(約一億四千萬)相比,預計要蝕 \$42,470,881(約四千二百萬)。

後記:開彩後,新聞報道是次總投注額為 3.43 億,比我在開彩前見到的數字 3.20 億只多出 0.23 億,所以大包圍的話,虧損數字應有幾百至一千萬的調整,但整體仍是虧蝕。

結語
按昃思庭嘅假設,若今期只有一個人投注,而且係大包圍,咁佢投注一億四千萬,可以穩賺無賠。但係現實係有其他人投注,今鋪如果真係大包圍,反而會蝕四千幾萬,咪話唔甘。

如果多寶獎金夠高,大包圍又係咪必贏策略?好難講。第一,多寶獎金 J 滾得愈高,街邊嘅投注額 T 亦會趨高,若果 T/J 變大,反有機會令大包圍者分到嘅頭、二、三獎獎金 P'1, P'2, P'3 變小。第二,大包圍嘅最大風險,係有其他人實行同樣策略,令獎金攤得重薄。

其實好多年之前,已有江湖傳聞話有集團用大包圍方式 arbitrage。後來(1992年)六合彩有頭獎獎金上限,聽講就係要打擊呢種 practice。而今雖然取消咗上限,但係相信馬會係有計過條數,令大包圍者無咁容易得逞。