英語のみでいいんで、フリーのOCRソフトが欲しくなってもしかしたらMac OS Xで使えそうな物を探してみた。
ちなみに、環境はTiger(gcc-4) + Fink でっす。
Ocrad – The GNU OCR →ビルドが途中で失敗
GOCR(JOCR) →netpbmが見つからないと怒られるけど、一応ビルド成功。辛うじて動く。
ビルド手順:
joeys-PowerBook-G4:~/Desktop joey$ tar xvzf gocr-0.40.tar.gz
joeys-PowerBook-G4:~/Desktop joey$ cd gocr-0.40
joeys-PowerBook-G4:~/Desktop/gocr-0.40 joey$ ./configure
–中略–
checking for library containing pnm_readpnminit… no
* * * try option –with-netpbm=PATH
–中略–
joeys-PowerBook-G4:~/Desktop/gocr-0.40 joey$ make
–中略–
gcc -g -O2 -I../include -DHAVE_CONFIG_H -c -o gocr.o gocr.c
gcc -o gocr gocr.o -L. -lPgm2asc
if test -r gocr; then cp gocr ../bin; fi
— for help do: make help —
— for documentation do: make doc —
— for examples do: make examples —
joeys-PowerBook-G4:~/Desktop/gocr-0.40 joey$ sudo make install
CUIのgocr と GUI(tcl/tk)のgocr.tclがインストールされますが、GUIの方は案の定netpbmで文句いってちゃんと動かない。
でもCUIは
joey$ djpeg -pnm -gray Scan.JPG | gocr –
って感じでjpgファイルのOCRが可能でした。
ちなみに、認識率ですが、、けして優秀とは思えないレベルです。
タイプのさぼりができても、校正は必須ですね。
このファイルの検出結果が以下のようになります:
E_lv/mJ E(v/m)
T h
A A
t(s) _zfmt
Flgu_e 2.1 Electromagnetic wave _. Sto m
actjon picture: (a t Tj me de pendence _.
T- per:od (s), r– 1/T-rJequency _A _A
(cycle/s — Hzt; (bt space dependence_.
h – waveIength (m). at b)