tesseract은 OCR엔진이다. OCR이란 광학문자인식으로서 사람이 쓴 글씨나 기계로 인쇄한 문자를 인식하는 기술이다. 나는 영어 손글씨인식이 필요하여 tesseract를 이용하기 시작했다. 하지만 내 예상보다 결과가 너무 별로였다. 컴퓨터에서 작성한 파일은 정말 잘 인식을 했지만 그것을 출력한 인쇄물을 다시 사진으로 찍어 인식시키면 그것부터가 인식률이 매우 낮아지는 것을 알 수 있다. 손글씨 인식에 적합한지는 잘 모르겠다. 하지만 인식률이 낮아서 불만족스럽다면 학습을 시키면 된다는 글들을 보고 일단 시도해보기로 했다. tesseract를 학습시키기 위해 사용한 도구로서 jTessBoxEditor를 이용했다. jTessBoxEidtor는 box파일의 편집을 돕는 도구이다. 비슷한 도구로서 CowBox..