去年蒙僑委會遴派至中南美洲參加海外華文教師研習講座,會中有不少位老師提到打字速度的問題。於是,我簡單的示範了一下文字辨識(OCR)的應用,馬上得到很不錯的回饋,許多還不是很習慣中打的老師對於這樣的應用,產生了極高的興趣。對於習慣打字的朋友來說,中文打字不算什麼太大的問題。但如果對打字還不甚熟練,如果想運用數位方式教學,真的有點辛苦。例如:

這是段我在阿根廷新興中文學校以小數位相機當場拍下來的文宣,您得花多少時間將這張圖片上的文字轉換成可以編輯的文字呢?如果得超過3分鐘,其實還挺辛苦的。建議您三種方式:
1.不斷練習打字,熟能生巧;
2.請兒子女兒先生太太隔壁同仁幫重打;
3.使用文字辨識軟體,讓電腦幫您認字。
雖然我自己很認命選了第1種,但其實都是因為2的影響才讓我的打字速度進步神速。如果您二種都不想選,這篇介紹第3種的用法。
由於先前在課堂上介紹的軟體都需要$$的支援,因此只是示範而已。另外,雖然大家常用的office軟體也能夠用來做文字辨識的處理,但它只支援tiff檔案,坦白說親和力也不是太高。終於,被我找到了一個可以運用office辨識引擎的小軟體-JOCR。 拜office所賜,它可以辨識超過20種文字,操作起來也相當簡單,整個流程幾乎都包含在這張圖片裡:
看到了嗎?以上圖為例,全球華文網首頁有張徵稿的flash圖片,經過擷取後,再選擇字元辨識,就自動轉換成純文字文件了。多方便!步驟如下:
1.請先確定自己的電腦是否安裝Microsoft Office Document Imaging(Microsoft Office文件掃描)工具。雖然JOCR是免費軟體,但因為它以office文件掃瞄工具為核心,因此嚴格說起來也不是免費軟體。
2.至http://home.megapass.co.kr/~woosjung/Files/JOCR.exe 下載JOCR軟體,它是一個80幾K的小工具。
3.接下來就開始使用它了!在電腦上開啟任何圖片檔,或直接在網頁上看到任何包含文字的乾淨圖片(為什麼要乾淨?太多雜點、圖形一定會影響辨識效果;為什麼要圖片?如果是文字就可以直接複製貼上啦,幹嘛要辨識…
) 後,打開剛下載回來的JOCR
4.開啟程式後,會出現如下圖的介面。步驟有3:選擇擷取畫面,可以是螢幕上的區域,可以是桌面,也可以是視窗。以這篇文章為例,各位可以直接選擇擷取區域,直接從螢幕畫面上擷取圖片;接著,請選擇最下方的下拉選單裡的辨識文字種類;確定之後,按下"recognize"鈕,程式會自動跳出一個純文字視窗,顯示辨識結果。
5.以這張圖片為例,辨識出來的文字是「在閃耀慈母光輝的五月天 · 本華文語言中心於十七日舉辦慶祝一年一度母親節的特別活動。是日上午十一時在司儀對來賓致歡迎詞中準時開始,神學院教務主任羅家楝牧師首先為媽媽們及所有的學生祝禱,並勉勵在場的家長們,教導孩子當用真理的道,使他們就是到老也不偏離。同時也提醒在場所有為人子女者,當孝敬父母,因為這是理所當然的,而且使人得福,在世長壽。」
總共錯了一個標點和一個字,這樣的結果我還挺滿意的。但必需強調的是並不是所有圖片都會得到和我的實驗一樣的結果,一定要選用乾淨無瑕、對比高的電腦字型圖片才可能得到滿意的辨識成果。在天時、地利圖也和的情況下,運用文字辨識軟體的速度絕對比打字快,有興趣不妨玩玩看。