圖片文字辨識軟體~~JOCR

~~把圖片中的文字轉換成文字檔,省去打字的時間。~~

打字這個問題,經常困擾許多人。

例如拿到一個圖片檔,裏面有很不錯的文章時~~用圖片檔實在沒有彈性,無法隨意修改文字的編排格式,也無法加到自編的教材當中;但是文章一長串,打起字來費時費力,找別人代打又常常碰釘子,最後只好眼睜睜地放棄它了。

昨天 (2009/04/19) 在替溫哥華地區的中文教師們上基礎電腦課時,不經意地提到了 JOCR 這個免費的圖片文字辨識軟體,立刻引起大家的注意與興趣,紛紛要求索取相關資料,於是利用這個機會向大家介紹。

JOCR 軟體是我在僑委會連老師的部落格中看到的,在此要先感謝連老師的熱誠分享。

JOCR 圖片文字辨識軟體的下載網址:
http://home.megapass.co.kr/~woosjung/Files/JOCR.exe

JOCR它只是一個 84KB 的小軟體,但功能卻挺不錯。下載的檔案便是一個執行程式 (.EXE 便是執行程式的副檔名),因此不需要再經過安裝手續,可以直接使用。

經過點選以上網址,你可以儲存這個程式到你的電腦硬碟中。

JOCR程式 (JOCR.exe) 的圖示是一個小青蛙,請點選兩次把它開啟。

使用步驟如下:

1. 選擇要辨識的語言。JOCR可以辨識英文、中文、日文等等二十多種語言,功能挺不錯。在這裏,我們當然是要選擇正體中文。

2. 打開要辨識的圖片檔。

3. 回到 JOCR 程式,按下 Capture Region 按鈕。

4. JOCR 會自動隱藏,回到剛才打開的圖片檔。此時滑鼠變成一個 “+” 字,要求你框選出辨識範圍。方法是用滑鼠放在辨識範圍的左上方,按下滑鼠左鍵不放,拉滑鼠到辨識範圍的右下方,再放開滑鼠左鍵。

5. 此時 JOCR 又自動出現,並且在右方的畫面中出現剛才的範圍。

6. 按下 Recognize 按鈕。

7. 自動開啟記事本 (Notepad) 並且把辨識結果放在記事本中。這時辨識工作已經完成,我們可以把記事本中的結果,全部複製到 Word 中,然後再逐一檢查是否有錯誤。

在使用 JOCR 程式時,有幾點注意的事情:

1. 萬一 JOCR 程式不能用,請看看自己的電腦中是否有安裝 Microsoft Office Document Imaging(Microsoft Office文件掃描)工具。因為其實它是藉由Office文件掃描工具來運作的,沒有Office文件掃描工具就不能動作了。

2. 圖片檔必須儘量沒有背景圖,且文字與背景的對比愈明顯愈好。否則很可能受到背景圖的干擾,或是文字與背景顏色太接近的影響,大大降低了正確性。

3. 圖片檔的文字必須是電腦字才行,手寫的字會使辨識率變得不理想。

4. 怎麼樣把紙張的文字辨識出來呢?當然是要把紙張變成圖片檔,才能進行辨識。變成圖片檔的方法通常有二:一是利用掃描器把紙張掃描。掃描時把解析度調高一點(至少 200dpi),並且定為黑白圖片即可。二是可以用數位相機把它拍下來,拍時要注意到角度,字體要正,也是儘量把畫素調高一點(大約二百萬到三百萬就可以了)。

6 thoughts on “圖片文字辨識軟體~~JOCR

  1. 今天(5/9)上完蘇老師的電腦進階課,馬上複習,先前一些部落格的疑慮,馬上解決,電腦是要慢慢「玩」出來的,一定自己多多用功練習。
    晚上挑燈夜戰時,發現這篇把圖片中的文字轉換成文字檔,省去打字的時間,太棒了,要來試試看。

  2. 今天(五月十日)早上, 上了蘇老師的電腦課,
    獲益良多, 謝謝蘇老師, 你辛苦了!!!!
    >.

  3. 感謝您的教學說明,此程式的應用我覺得僅能用單一語系文字
    若圖片中有中、英、數、符號,不管您用什麼語系去辨試都會出現不完整情況。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *