|
醉心研究人工智能及「自然語言處理」,專注教電腦系統「說話」,黃錦輝不揀普通話、英語等全球最具商業價值的語言,偏偏選擇全球較少人使用的廣東話, 「傻事」做盡只為走出Comfort zone(舒適區),黃錦輝淡淡然笑說:「好多人當我傻,但如果語言因為無商業價值,而唔用數碼化方法留住,過多三十年就會無晒(失傳)。」
他作為別人眼中的「傻人」,其實是本港首間電子中文報社搜尋公司慧科訊業(Wi s er)的創辦人,每每將「傻事」變為能改變世界的新發明。這位非常科學家,今年5月更獲中國人工智能學會選為「自然語言處理與理解」組別的智庫專家,是六十一位獲選者中唯一土生土長的香港人。
頂硬上 賺取人生
在人工智能領域屢獲突破性科研成果的黃錦輝,沒有一般科學家的嚴肅,反而予人親切的印象,說話時嘴角總不其然微微上揚,露出笑靨。記者未進入其辦公室前,還以為?面盡是機械人「殘肢」零件,但進內後發現自己想多了,與一般大學辦公室無異,全場最吸睛是桌上一個刻有「Never get so busy making a living, that you forget to make a life」座右銘的擺設。這句話有人翻譯成「永不要忙碌到只顧賺取生活,而忘記賺取人生」,警醒後世別太着重賺錢,而忽略人生意義,大概這個座右銘足已解釋,他在芸芸語言當中,偏偏選全球商業價值較低的廣東話語音處理系統,作重點研究的原因。
他最擅長研究人工智能中的「自然語言處理」,說得簡單一點就是教電腦系統說話。正如商業機構網站上的聊天機械人,正正要靠他教電腦對答才可成事。「消費者可以透過某些機構的網站、推特或微信,和機構傾偈。其實部分是機器,不是真人,你唔知道。」
雖然八、九成香港人都以廣東話作為日常主要語言,但放眼世界的話,廣東話人口只佔極少數,相比之下普通話、英語等的需求更殷切,商業價值更高,黃錦輝卻對廣東話情有獨鍾,不問回報地教電腦系統講廣東話,「好多人都當我傻,但就算無商業價值都應該要做。如果語言因為無商業價值,而唔用數碼化方法留住,過多三十年就會無晒,現在要趁廣東話仍廣泛被應用時保存,以免失傳。」他最擔心一些稀有的語言漸漸失傳,整個文化隨之消失,並慨歎香港事事以利益為先,「科研唔應該只賺錢,香港是奇怪的地方,是經濟主導的地方。衡量效益時,好多時都諗賺幾多錢,但效益唔應該咁單一。」靠一股傻勁,他與團隊懶理別人潑冷水,花了兩年透過龐大數據庫及人工智能技術,去年發表「錯字和粵語檢測系統」。
無可取代
醉心人工智能的研究三十載,對於近年愈來愈多人質問,日後機械人會否取代人類統治世界?黃錦輝不帶半點猶豫說:「梗係唔得!無可能!」他以圍棋機械人AlphaGo 贏了棋王作為例子,「AlphaGo 贏到人梗係叻, 但造到AlphaGo出來的人更勁!機械好多時都是做輔助,減輕人類日常生活麻煩的程序,機械同人類仲有好大段距離。」
人類最煞食是變通,這是機械人永無法追到人類的主因。而變通也是黃錦輝科研路上重要的武器,其中一項成名作是電子中文報社慧科訊業(Wiser)。這個中文新聞搜索系統,記載約二十年大大小小的報章內容,只要按搜尋鍵,就可以進入「時光隧道」重溫舊新聞,是所有記者攞料的必備網站。
慧科本來只是一個校園科研項目,93年靠政府資金,黃錦輝帶領六名中大學生研究中文搜尋技術。但當時這項服務未成氣候,不獲商業機構垂青,種子資金三年後「乾塘」見底。儘管如此,黃錦輝仍雄心勃勃,與六名學生每人集資十萬港元,發展電子剪報生意。「現在大家講的創新創業,二十五年前我已經在做!」他自豪地說。
每項新服務的成功往往取決於天時、地利、人和,當時的資訊科技未及目前般發達,市民主要靠紙媒接收資訊,大企業為掌握傳媒如何報道它們,專門聘請剪報公司搜羅相關報道。適逢《版權條例》於1997年生效,衝擊着剪報公司,黃錦輝靈機一觸,「一份報紙只可以一個人看,怎麼你可以四、五十個人一齊睇呢?當時其實政府部門都有幫襯,政府都違法,唔得啦!」翌年,他與報界達成合作計畫,成為版權法下唯一提供電子版剪報的公司。「與其市民違反版權法傳閱報章,一毫子都唔畀報社,不如與我們合作分帳,賣十蚊畀一蚊你(報社)。報紙商會覺得幫咗佢哋電子化,又有利潤,就合作。」湊大慧科後,黃錦輝功成身退,找下個能改變世界的新發明。
|
|
|
|