FairShare-創用CC授權品追蹤器

最近的課程裡常會跟大家分享創用CC的概念,當我們自己決定以創用CC的方式授權自己的創作後,就可以讓別人逕行取用,只需要遵照我們所設定的授權方式即可。但我自己說著說著也會懷疑在別人用了自己分享出去的創作後,真的會照做嗎?剛好,剛剛在ReadWriteWeb網站上看到這篇:Track Your Creative Commons Works in the Wild With FairShare.大家可以直接上去看看FairShare這個網站的概念,它會以RSS的方式回報網站內容被引用的結果,剛好可以解除這個疑慮。

很可惜,這項服務目前看來還不支援中文,不過我已經申請試用了,如果中文也能有追蹤的結果我會立刻回報。這個網站對於在網站/部落格上使用中文分享教學經驗、教材或創作時有疑慮的老師們,或許會有幫助!

文字辨識軟體的應用

去年蒙僑委會遴派至中南美洲參加海外華文教師研習講座,會中有不少位老師提到打字速度的問題。於是,我簡單的示範了一下文字辨識(OCR)的應用,馬上得到很不錯的回饋,許多還不是很習慣中打的老師對於這樣的應用,產生了極高的興趣。對於習慣打字的朋友來說,中文打字不算什麼太大的問題。但如果對打字還不甚熟練,如果想運用數位方式教學,真的有點辛苦。例如:

這是段我在阿根廷新興中文學校以小數位相機當場拍下來的文宣,您得花多少時間將這張圖片上的文字轉換成可以編輯的文字呢?如果得超過3分鐘,其實還挺辛苦的。建議您三種方式:

1.不斷練習打字,熟能生巧;

2.請兒子女兒先生太太隔壁同仁幫重打;

3.使用文字辨識軟體,讓電腦幫您認字。

雖然我自己很認命選了第1種,但其實都是因為2的影響才讓我的打字速度進步神速。如果您二種都不想選,這篇介紹第3種的用法。

由於先前在課堂上介紹的軟體都需要$$的支援,因此只是示範而已。另外,雖然大家常用的office軟體也能夠用來做文字辨識的處理,但它只支援tiff檔案,坦白說親和力也不是太高。終於,被我找到了一個可以運用office辨識引擎的小軟體-JOCR。 拜office所賜,它可以辨識超過20種文字,操作起來也相當簡單,整個流程幾乎都包含在這張圖片裡:

看到了嗎?以上圖為例,全球華文網首頁有張徵稿的flash圖片,經過擷取後,再選擇字元辨識,就自動轉換成純文字文件了。多方便!步驟如下:

1.請先確定自己的電腦是否安裝Microsoft Office Document Imaging(Microsoft Office文件掃描)工具。雖然JOCR是免費軟體,但因為它以office文件掃瞄工具為核心,因此嚴格說起來也不是免費軟體。

2.至http://home.megapass.co.kr/~woosjung/Files/JOCR.exe 下載JOCR軟體,它是一個80幾K的小工具。

3.接下來就開始使用它了!在電腦上開啟任何圖片檔,或直接在網頁上看到任何包含文字的乾淨圖片(為什麼要乾淨?太多雜點、圖形一定會影響辨識效果;為什麼要圖片?如果是文字就可以直接複製貼上啦,幹嘛要辨識…Kiss) 後,打開剛下載回來的JOCR

4.開啟程式後,會出現如下圖的介面。步驟有3:選擇擷取畫面,可以是螢幕上的區域,可以是桌面,也可以是視窗。以這篇文章為例,各位可以直接選擇擷取區域,直接從螢幕畫面上擷取圖片;接著,請選擇最下方的下拉選單裡的辨識文字種類;確定之後,按下"recognize"鈕,程式會自動跳出一個純文字視窗,顯示辨識結果。

5.以這張圖片為例,辨識出來的文字是「在閃耀慈母光輝的五月天 · 本華文語言中心於十七日舉辦慶祝一年一度母親節的特別活動。是日上午十一時在司儀對來賓致歡迎詞中準時開始,神學院教務主任羅家牧師首先為媽媽們及所有的學生祝禱,並勉勵在場的家長們,教導孩子當用真理的道,使他們就是到老也不偏離。同時也提醒在場所有為人子女者,當孝敬父母,因為這是理所當然的,而且使人得福,在世長壽。」

總共錯了一個標點和一個字,這樣的結果我還挺滿意的。但必需強調的是並不是所有圖片都會得到和我的實驗一樣的結果,一定要選用乾淨無瑕、對比高的電腦字型圖片才可能得到滿意的辨識成果。在天時、地利圖也和的情況下,運用文字辨識軟體的速度絕對比打字快,有興趣不妨玩玩看。