본문 바로가기

Dev/RPA

OCR 한글학습 .

반응형

OS : Windows 10

Language : Java

program : jbossjTessBoxEditor-2.2.0

 

준비물 

jbossjTessBoxEditor Down 

https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/

 

다운받은 jbossTessBoxEditor 압축 풀고

1. JTessBoxEditor 실행

2. TTIF/Box Generator 탭 선택

 

3. Output 위치 설정

 

 

4. 언어코드 변경

 

 

5. 원하는 폰트 선택

 

 

 

6. 생성될 tif파일명 변경

 

 

7. 학습시킬 글자 입력

 

txt 파일을 열었습니다.

 

8. Output 위치를 지정후 Genertate

9 Box Editor 탭으로 변경 후 Open으로 생성된 tif 파일 열기

 

 

10 각 글자마다 잘 구분되었는지 확인 후 저장

 

11. Trainer 탭으로 이동

 

 

 

tiff 파일이 생성된 폴더 지정

저장될 파일명 입력 ( kor이 아니어도 한글인식됨 )

Train with Existing Box 선택후 Run!

학습이 완료되면 tiff 저장된 폴더에 tessdata > kor.traineddata 생성 확인


참고 페이지

https://wookiist.tistory.com/9

https://yunzema.tistory.com/14

https://sehyo88.tistory.com/entry/tesseractocr-%ED%95%99%EC%8A%B5%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%8C%EB%93%A4%EA%B8%B0

 

OCR 광학 문자 인식 라이브러리

Tesseract 다양한 OS를 지원하는 오프라인 OCR 엔진, 무료 오픈소스 라이브러리, 2006부터 구글 지원, c/c++구성 사진 촬영을 해서 이미지를 넘겨주면 분석하는 프로세스 ( 구글 모바일 비전처럼 촬영영상에서 바..

yunzema.tistory.com

 

반응형