今年除了在台灣華語文教學年會當卡麥拉桑在各演講室穿梭外,也順便跟在B大後頭發表了一個硬湊出名字的全漢字檢索系統:ACCESS。它的全名叫Advanced Chinese Character Electronic Search System,至於為什麼要這麼叫?最近許多和華語文教學相關的真正國家級大計畫都會有一個很酷的縮寫,基於輸人輸陣輸光光但還是要取個漂亮名字的原則下,讓大家可以自由存取、取用、取出…whatever的ACCESS系統就誕生了。
這是什麼碗糕?對華語文數位教學有什麼幫助?基於當前不讀書不寫paper做再多事都不算頂尖的前提下,先引用學者專家的論著,說明我們為什麼要做它:
葉德明(1990)指出學習漢字的最佳策略即利用字素符號作為記憶術,直接擷取其意符線索以記憶符號。學習者都可以先記住圖形符號,然後學習聲符部分,如此,學習漢字就成為容易且有趣的課程了。
黃沛榮(2005)認為漢字教學策略應:先認識收字最多而重要的部首;先學寫構字較活躍的部件;先學會構詞率較高的字
陳奕全、葉素玲(2009)的研究表示部件本身可單獨成字,具有讀音與字義(如「楓」中的「木」與「風」)。在習字的階段多先以形體簡單且具象的獨體字(如「木」)做為入門練習直到精熟,之後再教導與其他部件組合成不同的字。
當字頻相當,但部件的組字數不同時,學習者對具有高組字數部件的字反應較快(Feldman and Siok, 1997)
若結合部件與結構資訊,將可加快文字的處理流程。例如「楓」的部件為「木」、「風」、結構為「左右結構」。此輸入單元上傳至字形層次後,再進一步激發字音層次及意義層次。結果顯示,只須輸入部件的形體及位置關係,便可完成後續的字音及字義的處理。(Perfetti , 2005)
部件的錯覺組合現象,顯示出這些字的部件表徵先被激發。(ex:「核、討、該」=>村 )( Fang and Wu, 1989)
簡單的來說,當老師們拿到一則課文或自己撰寫發展了一套教材後,先教學生寫哪些單字不一定得看課本上生字的出現順序,從字素,也就是有意義的部件開始教,可以讓學生更容易學習更多的漢字。
這下問題就來了。從以前到現在,大家忙著為漢字、詞彙分等級,一整篇文章哪些是高組字數部件,構字率高?總不能一個一個算。為了方便老師們分析自己的教材,ACCESS再度展示「科技始終來自於人性」、「效率最終來自於科技」的特性,老師們只要直接在網頁上張貼教材內文,系統便能自動檢索、分析課文字詞,並統計教材或課文的部件資訊、生詞來源、漢字資訊等內文量化元素,透過B大得意的演算法,立即取得整篇文章的量化資料,以為教學或教材編輯的參考依據。無論您主張字本位或詞本位,只要將文章貼上,系統會立刻將裡頭的字拆光,並根據TOCFL詞表提供詞彙建議。
ACCESS提供二種主要功能:
1.漢字查詢:

目前提供 35,841 個漢字的相關資訊,包含部首、筆劃、結構、部件、注音(含破音)、拼音(含破音)。除了基本資料外,ACCESS也提供漢字部首字圖片,目前共建置 7,870 字部首字圖;除部首字圖外,也提供漢字筆順字圖片,目前共建置 3,578 字。這些圖片都另外有高解析度版本,若您有教材製作或開發需求,歡迎留言洽詢。由於我們沒有經費,更只有少少的人力,這些圖片增加得可能不夠快,但每天仍會持續增加,希望有機會做到查詢不破圖的程度。
2.內容分析
只要老師們將課文或生詞表貼入ACCESS,系統將依據部件表(目前參考CNS11643,但我們正在進行更符合漢字教學用的部件研究,未來會再全部置換成華語教學版部件表)進行拆解,藉此產生部件頻率-漢字對照表。藉由內容分析,老師們可以很快的知道該篇文章所使用的部件及各部件之頻率高低,作為教學的參考依據。另外,ACCESS亦與國家華語測驗推動工作委員會之<華語八千詞> 整合,教師依學生程度選擇Beginner、Learner、Superior或Master等級,系統將會參考學生程度,過濾出所學漢字,提供教師在教學上的延伸應用。
操作的方法很簡單,只要將文章貼入系統,按下分析:

系統就會馬上跳出一個部件分析表:
以這篇文章的前二段為例,「口」出現了45次,「一」出現了44次。如果它是課文,這二個部件重不重要?要不要教?如果您將現在的教材全部倒進去,哪些是活躍部件一眼便知。
還不止這樣。部件旁有個more按鈕:
點下去就可以知道在這個部件所構成的字族裡,哪些字是該程度的學生已經,或應該學過的:

最後,點選詞組前的漢字,可以連回漢字查詢,檢索該字的基本資料。
我們希望這套系統能做為華語老師們在進行漢字教學前的檢索工具,對教學能有一點貢獻。特別需要注意的是,10/30日在成功大學發表時,賴明德教授認為目前部件仍有爭議,希望我們能定義得更清楚。這點我們知道,但也困於仍無權威文獻,所以才先選用CNS11643-2部件表為資料庫拆碼依據。未來將持續廣徵專家學者的建議,希望能將部件重新以華語教學為主的最有意義單位分級:
為了讓大家能盡快使用,所以我們先推出這個版本,後續需要專家學者協助的地方,還請不吝賜正。這個系統沒有任何計畫以及資金的支持,完全出自於對華語文數位教學的傻勁。我們相信資料的量以及參考資料的正確性應該都在水準之上,所以先推出讓老師及研究人員試用。如果有任何問題,歡迎在這篇文章的迴響上留言,我們會盡快改進。若您發現任何錯誤,也請罵小力一點,謝囉!
點此前往ACCESS全漢字檢索系統
Credits:
Bytes Li, Lienyujen, Bobbit and 二位勞苦工高日日CorelDRAW的工讀同仁