Aug 22 2008

GC!J 更新

原來 GC!J 已有一年歷史,最近和電鋸商議後轉到 google code,方便管理,亦歡迎任何人提意見或參與維護。

趁今日打風有空,我更新了 GC!J 到 0.3b,把那些字碼存放到另一個 JS 檔再用 XHR 擷取,有新字碼時就不需要重新安裝整個 User Script,容易管理得多。

不知 GC!J 為何啥的我就再說一下吧:
GC!J 是一個 Greasemonkey user script,它主要把壹傳媒 那些圖像香港字轉為實在的文字,並把中文字間的空格移除,方便用家轉貼新聞。若想保留中文字間空格,可按 Firefox 的 Tools -> Greasemonkey -> User Script Commands -> Toogle Chinese Spaces。

安裝
GC!J 0.3b 需要 Firefox 3.0 或以上1Greasemonkey。安裝 Greasemonkey 後到 GC!J project home page 按 Installation 下的連結就,再 reload atnext.com 就可看到效果。

Know Issues
蘋果動新聞的圖片說明因為會不停轉換,文字會再被轉回圖像。2

若有意見歡迎留言,發現 bug 的話亦請留言相告,謝謝。CT

  1. 因為用到 native 的 getElementsByClassName []
  2. 這個走馬燈式的圖片轉換方法真的好 Web 1.0,既不 accessible 亦不 user friendly,其實整個動新聞網真的 “動” 過籠,版面亦怪怪的。 []

Jul 24 2007

蘋果裡的香港字

Chainsaw 寫 Userscript,我也做過,不過用的是 PHP。

幾年以來,我一直在用一個自己編寫的 PHP script,把生果日報的網上版「淨化」後給我在 Palm 上看。當時曾考慮像 Kornhill 一樣公開使用,不過知道生果報曾出信警告提供這類服務的網民1,所以只好「收收埋埋」獨自「享受」自己努力的成果。

其實當時已有人做了相同的東西,並且開放源碼2,不過那個 script 有一點我認為不夠貼心的,就是保留了生果報的圖像香港字,那些圖像字在 Palm 上看實在太醜樣,而且浪費 bandwidth。於是決定自己寫個 function,好替我取得內容時把那些醜樣的圖像字一一換掉為實實在在的香港字 (Big5-HKSCS)。

編寫初期還以為那些十六進制的圖像字檔名是對應那個字的內碼,只要找到檔名,再 generate 那個香港字就行3,但後來發覺那些十六進制檔名並非內碼,哪怎樣才知道它們的配對呢?思前想後還是用個蠢方法,暴力地把所有生果報的圖像字列出來,逐個逐個把其所示的香港字編成一個表,放入一個 associative array,再跑一句 preg_replace 就搞掂了。

以下是這個 function 的完成品,我還另存一個純文字檔,只列出圖像和文字的配對,大家有用請自便。

其實,生果肯改用 UTF-8,不就更好?

Update: 強烈建議使用新版 GC!J,睇生果報順眼好多。CT

  1. 那時 Web 2.0 還未興起,大部份網站都視網站上資訊為賣錢的主要途徑,尤其本身有推出收費 PDA 頻道的生果報,會主動打擊這類 PHP。 []
  2. 源碼現在一直還流傳着,雖說曾被打壓過,但總有人繼續做的,只是較為低調而已。 []
  3. 這應是三數行 code 就辦到的事,而且一勞永逸。 []