【聲明】港生活網站並無進行電話推廣活動

準繩度逾8成 中大研系統揪錯別字

發佈時間: 2017/06/12

中大工程學院團隊花近兩年,以歷屆文憑試考生的答卷及個別學校和補習社模擬試卷建立數據庫,研發出「中文錯字和粵語檢測系統」,除能識別錯別字和簡體字外,系統首次引入粵語元素,可偵測到口語及倒裝詞。

中大工程學院副院長黃錦輝指系統屬供學生自學性質,準繩度逾8成,但承認不能單靠系統便能提高語文水平,須校內老師配合。中大工程學院早年獲應科院邀請,研發出以考試為本的自動中文檢測系統,系統目前在部分學校及補習社測試。

網上語言損書面語表達力

系統以網頁形式運作,用家只需輸入最少10個字的句子,系統便自動檢測當中所包含的問題,並向用家提供正確字詞的建議。現時系統準繩度逾8成,但不能偵測英文,如潮語「hea」等。研究團隊計劃今年內將系統轉化為辦公室軟件,開放予公眾,長遠或會考慮將系統產品化。

黃錦輝指,學生習慣在網上以口語或縮寫等方式與人溝通,直接影響書面語表達能力,導致學生應考時出現大量錯別字等。

黃指,系統建立初期,數據庫具有過百萬個字詞組合,由於系統使用「機器學習」方式,使用次數愈多,數據庫將累積更多字詞組合。待系統成熟後,長遠可應用於不同方面,如補習社可透過系統測試新生的能力,以便安排入讀適合班別。