2011年11月30日星期三

有志成為 Jack the Ripper 者請報讀

不得不打倒昨日的我了。史丹福大學醫學院竟然也開設網上課程,教授解剖學,更完全毋須預備知識。(當然,無得實習!)哇~哈哈哈哈,我已感到自己邪惡的血脈在沸騰!

2011年11月29日星期二

眨眼又一年

真係要善用時間。



我素來都唔鍾意細路仔學大人唱情情塌塌的歌,總覺得好似上「殘酷一叮」標奇立異。人情咁複雜,細路唔使咁急失去童真嘛。下面呢段片,結尾時女孩箇一笑雖然造作,但總勝過扮晒投入感情,算係挽回成條片的格調。

2011年11月23日星期三

拼命拚命拌命判命

一個人嘅出生呢,係無得揀嘅,但係呢……一個人佢決定嘅革命路線,係有得揀嘅。
 ── 廿一世紀香港資產階級革命家唐英年同本文唔啦更嘅語錄[*]

古人有避諱之舉,但我今日看古德明的專欄文章《成語的墮落》,方知原來在所謂「新中國」,辭書編者為了避免冒犯國家領導人,亦要指鹿為馬,收入偉大舵手誤寫而成的「前赴後繼」,正確寫法「前仆後繼」反而從辭書消失,嗚乎。

古德明又提到華國鋒曾將「拚命」誤寫成「拼命」,而後來內地的文字改革委員會,亦以「拼」代「拚」。「拚命」一詞,本網誌以前也提過。香港俗諺「pun2 死無大害」,其中的 pun2 就是「拚」(粵拼 pun3)白讀時的變音。平時有些人說「拼命三郎」,其實亦搞錯了《水滸傳》中「拚命三郎」石秀的綽號。

「拚命」雖為正寫,「拚」字卻非本字。「拚」這個單字有多重意義,而作捨棄解,查實係「拌」的俗字,詳見台灣《教育部異體字字典》。漢.揚雄《方言.卷十》:「拌,棄也。楚凡揮棄物謂之拌」。「拌命」一詞,可見於宋.黎靖德《朱子語類.卷一一六》:「拌命進前, 有死無二, 方有箇生路」。

然而清代《經典文字辨證書》又認為「拌」是「判」的俗寫。「判命」一詞,亦見於古籍,宋.王稱《東都事略.章惇傳》就提到蘇軾說章惇「能自判命者,能殺人也。」由於《東都事略》、《朱子語類》與《水滸傳》三本書的成書時間,前後相差不過一百年左右,也許「拚命」這個俗寫,差不多從一開始就變得普及。

附註 [*]:語錄中「出生」一語,係唐先行者說的。正確的字眼應該是「出身」(「身」字無鼻音)。日後辭書會否因將就唐語錄而改「出身」為「出生」,如同傳媒為了曾特首而改「感同身受」為「身同感受」,各位不妨放長雙眼看。

2011年11月21日星期一

Windows XP 的 Octave 繪圖視窗問題

若果讀者如我一樣,於 Windows XP 上裝 Octave 而發現它的繪圖視窗有不正常表現,那可能是一個稱為 oct2mat 的 package 在作怪。解決辦法,請參考以下網頁:
我沒時間逐個方法試,所以一口氣將它們全部用上。現在問題似已解決。簡單來說:
  1. 運行 Octave,於 Octave prompt 輸入 pkg rebuild -noauto oct2mat 指令,然後關閉 Octave。此指令會卸除與 gnuplot 有衝突的 octmat 套件。若用家日後有需要,可於 Octave prompt 打入指令 pkg load oct2mat 重新安裝。
  2. 於安裝 Octave 的檔案夾內尋找名為 ginput.m 的文件,將它改為其他名字,例如 ginput.xx.m 或 ginput.m.bak 之類。網頁說新版的 Octave 其實已有 ginput 的功能,故此用不著此文件,不過穩陣起見,改名勝於刪除檔案。
  3. 另外尋找一份名為 __gnuplot_ginput__.m 的文件,於第 112 行,亦即 while (isempty (str)) 迴圈開始以後,加入 sleep(0.05); 一句(留意結尾的 semicolon)。
  4. 又,尋找一份名為 __plt__.m 的文件,於 function 結束之前,亦即最後一行的 endfunction 敘述之前,加入 pause(0.05); 一句。

2011年11月17日星期四

史丹福 2012 年春季公開課程

Stanford U. 的工程學院於來季會開設多項免費、公開但無學分的網上課程,而該校其他學院與另外一些大學院校亦紛紛響應,例如 UC Berkeley 就開設下述的 SaaS 課程。比起 Stanford 今季只開三科,來季起碼合共有七個九個超過十個不同科目,執筆時數目仍在增加,不能盡錄。有興趣的朋友不妨報名。

身為過來人,奉勸各位,無論課程有多吸引,最好還是只讀一科,否則時間實在太吃緊(我今季報讀了兩科,而且課程中近半都是我原本就懂得的東西,但仍是感到「困身」和吃力),但各位可以先報多個課程,然後才決定主攻那一科,而放棄其餘。
後記:我報讀了 SaaS 及 NLP,開學後看情形才決定是否放棄其中一科。NLP(是 natural language processing,不是那種騙錢的 NLP)是我一直想知的範疇。SAAS 則不然 ── 事實上我覺得自己「未夠班」去學 ── 但它的課程看來十分實用,又似有 hands on 的 programming exercises,所以一試。教授們的英語也是我考慮報讀的原因。看兩個課程的簡介短片,四位教授的英語都非常清晰,100% 聽得懂,比起今季 AI class 兩位教授,實在好太多了。

Word play


這個噱頭着實有趣,給商戶利用一次也無妨。

2011年11月11日星期五

馬弔、馬吊與 search engine optimization

記得以前坊間有不少書籍教人做 search engine optimization,但基本上都是英文著作,而近來我就遇上一個意想不到,關乎傳統中文與簡體字的搜尋排名優化問題。

事情是這樣的。個半月前,我的「重構明代馬弔牌例」系列文章完稿,心情難免有點興奮,覺得若要於網上搜尋馬弔牌規,拙文即使不在第一位,也應該出現於搜尋結果的首頁吧。

然而事實出乎意料。若搜尋「馬弔」 ,無論是 Google, Yahoo 抑或 Bing,我的文章的確現於首頁,但是搜尋「馬吊」的話,就連影子都無。有趣的是,尋找「馬弔」 ,三個搜尋器都會顯現含有「馬吊」一詞的網頁,但反過來則不然。由於「吊」也是「弔」的簡體字,可能各搜尋器均對關鍵詞有「繁→簡」轉換,卻不會反過來利用「簡→繁」變換來擴大搜尋範圍。

可是「馬吊」只是近人寫法,古籍中,此牌戲的名字幾乎一律是稱為「馬弔」的呀!難道為了推高搜尋排名,就要改「弔」為「吊」?總覺得很難妥協。最後,我嘗試於系列的每篇文章中都加入
(關鍵詞:馬弔、馬吊、打馬吊、馬吊牌)
一句。個半月以來,若搜尋「打馬吊」,拙文排名在 Google search 之中正穩步上升,從二十頁開外上升到執筆時的第十頁,總算有少許成效。然而,若搜尋「馬吊」或「馬吊牌」,拙文依然未見影。

這是個很好的教訓。若讀者想提高你們的網頁排名,某些關鍵詞,還是採用通用(儘管未必正確)的寫法為妙。

2011年11月9日星期三

披一身星塵


許冠英(1946-2011)

兩天前,北風近,漆黑臨。
不虞又聞噩耗。願逝者安息。

香港人真重視學術

今屆區議會選舉剛剛落幕,選舉管理委員會主席馮驊表示,政府今年接獲十宗以個人或團體名義提出的票站調查申請,全部聲稱目的為「學術研究」。他說:
如果有機構申請在某一個選區之內的票站進行票站調查,而這個選區裏面有候選人和這些機構有密切聯繫的話,那麼原則上我們是不會批准這類申請的。
結果十宗申請之中,政府只拒絕了其中一宗。我倒有興趣知道申請人是誰,以及申請遭拒的原因。

只要打正旗號,我不介意政黨利用票站調查結果來調整選舉策略。然而現在這些票站調查機構,有多少是由親北京的第三者資助的選舉機器,打着學術研究的幌子,從選民口中輕易騙取情報,又不用申報開支,大家心知肚明。可惜,除非有線人告密,否則要捉賊拿贓,絕不容易。

今年獲准作票站調查者如下(亦見有線新聞):
  • 香港研究協會(梁振英及范徐麗泰為協會顧問,理事會主席為新一代文化協會總幹事蘇祉祺,曾任中央政策組非全職顧問;今年於 206 個選區作調查)
  • 香港社區研究中心(負責人為新界社團聯會元朗地區委員會成員胡春月;157 區)
  • 香港社會監察(負責人為民建聯黃大仙統籌主任鄧秀玲)
  • 港大民意研究計劃(19 區)
  • 民意咨詢中心有限公司(15 區)
  • 南區民生促進會(8 區)
  • 盧曼思(週刊記者;3 區)
  • 嘉智學校(1 區)
  • 某人(1 區)
「港大民意研究計劃」的鍾庭耀提及 2004 年立法會選舉時,曾說:
筆者根據選管會網頁上的資料,再核對兩支香港大學研究隊的內部資料,整理出一個人力資源數表。由於選管會的資料有不少重疊之處,筆者只能盡量精確。數表顯示,七支研究隊中,公共事務研究學會最人強馬壯,其次是香港社會及經濟研究所,再其次是香港青年協進會,合共派出接近二千人在超過三百個票站進行調查。再細察三大機構所選的票站,區域分明,就算其中兩個機構在九龍東同時出現,選址亦無一重疊。筆者沒有考究該等機構的背景,但所動用的資源,的確令人咋舌。
事隔七年,情況似無多少改變。以香港島為例,今屆區議會選舉,撇除有人自動當選的選區之後,共有 60 個有競爭的選區,而獲准在當中進行票站調查的團體有四個:
  • 香港研究協會(44 區)
  • 民意咨詢中心有限公司(11 區) 
  • 港大民意研究計劃(4 區)
  • 南區民生促進會(8 區) 
各機構當初申請調查的選區重疊如下:
A04 山頂:香港研究協會、港大民意研究計劃
A07 觀龍:香港研究協會、港大民意研究計劃
B05 大坑:香港研究協會、民意咨詢中心有限公司、港大民意研究計劃
C34 樂康:香港研究協會、民意咨詢中心有限公司
D05 利東:香港研究協會、南區民生促進會
D06 海怡東:香港研究協會、南區民生促進會
D07 海怡西:香港研究協會、港大民意研究計劃、南區民生促進會
D08 華貴:香港研究協會、南區民生促進會
D09 華富一:香港研究協會、南區民生促進會
D10 華富二:香港研究協會、南區民生促進會
D14 石漁:民意咨詢中心有限公司、南區民生促進會
D15 黃竹坑:民意咨詢中心有限公司、南區民生促進會
D16 海灣:香港研究協會、民意咨詢中心有限公司
其中, 香港研究協會與民意咨詢中心有限公司,出奇地只有三區重疊。若兩個機構皆隨機選擇要調查的選區的話,重疊不過三區的機會率,只有

$$
\left.\sum_{i=0}^3\binom{44}{i}\binom{60-44}{11-i}\right/\binom{60}{11} = 0.00053.
$$
平均要 $1/0.00053 \approx 1887$ 次選舉,才會遇到一次這樣的情況,而自九七年起,現在才是第四屆而已,真令我想買六合彩。

考究兩個機構的調查員名單的話,結果更有趣。為了預防意外,令運作上更有彈性,調查機構一般在提交調查員名單時,每區所填的人數都會多於實際需要,因此同一個調查員的名字,會出現在不同選區的調查員名單之中。例如香港研究協會提交的太古城東 (C0201) 及鯉景灣 (C0301) 調查員名單分別為:
  • 陳皓泓、李芷欣、黎芷欣、李志恆、梁詠欣、馬傑絲、陳樂融、黃翠霞、鄧志豪、穆家駿、吳雪蓮、李振禹。
  • 王珊、陳信宇、劉美岐、王梓瀠、嚴朗而、陸正喬、陳樂融、黃翠霞、鄧志豪、穆家駿、吳雪蓮、李振禹。
以上兩份名單有六個名字重覆。香港研究協會有些調查員,甚至出現於十三份名單之多。這種於名單上填上「預備隊」的做法很平常。例如港大民調,人手並不充裕,因此它所提交的每份名單,皆填上同樣的二十人,以便臨場調配人手。於最極端的情況,港大的隊伍甚至可以放棄某些選區,將人手全投入其他地方(實際上他們於選前一日決定全港只調查十區,而非原定的十九區;於香港島則放棄調查 D07 海怡西)。若事先提交的各名單上沒有重覆的人名,就不能隨機應變了。

基本上,「香港研究協會」與「民意咨詢中心有限公司」的每份調查員名單,皆由某數目的固定人手(人名只出現於該名單)加上另外某數目的預留兵力(名字出現於多份名單之上)所組成,只有三區例外,而這三區,就正正是兩個機構重疊調查的選區(即 B05 大坑、C34 樂康與 D16 海灣)。當中,香港研究協會的做法無變,但是民意咨詢中心有限公司唯有在這三區中,它的調查員方全是預備隊。

當然,兩個機構合作,互相告知對方的部署,是學術研究常見的事,我是不會勸讀者想太多的。若要從陰謀角度去看,總可以找到切入點。例如香港研究協會的調查員,許多都是公開招募回來的學生,若要雞蛋裏挑骨頭,我們可以問,為何好像有許多「左派學校」的學生當調查員?香港研究協會的百多位東區的調查員當中,起碼有一半的名字與培僑中學、福建中學及漢華中學的學生相同,甚至有培僑中學老師(李振禹)的名字。這是巧合嗎?這班中學生是否跟其他調查員一樣受薪?他們是出於自願還是不願拂逆老師,才被迫或被誘導當義工?

現今本地大學不斷削減預算,學者申請做一個一年二十萬的細 project 也不容易。香港研究協會這項「學術研究」,光是支付港島區 366 位調查員的工資,一天之內已經花去 \$146400,更遑論支付所有調查員及研究人員的開支了。連港大鍾庭耀這塊金漆招牌,也只能湊得七十多名義工,那些民間學術機構的金主,還真是重視學術呀!