티스토리 뷰

IX1500 스캔하면서 OCR 하기IX1500 스캔하면서 OCR 하기

Fujitsu ScanSnap IX1500 스캔하면서 바로 OCR 하기

지난 포스트에서 ScanSnap IX1500 사용자에게 무료로 제공되는 ABBYY FineReader TM 5.5 설치 방법을 소개하였습니다. 이번 포스트에서는 추가 설치된

Scan to Searchable PDF 옵션을 사용하여 스캔하면서 바로 OCR 을 하는 설정과 방법을 소개

합니다.


스캔하면서 바로 OCR 하기

ScanSnap Home 설정 방법

최적화된 옵션은 아니지만, Scan 하면서 OCR을 하기 위해 아래와 같이 설정하였습니다. 옵션은 사용하시는 분의 자유에 따라 선택하시면 됩니다. 빨간색으로 표시만 부분은 필수이거나 중요하다고 생각하는 옵션입니다. 

ScanSnap Home 설정ScanSnap Home 설정, PDF 파일 옵션, 급지 옵션


출력을 PDF로 하기 위해 모든 장을 문서로 스캔합니다. PDF로 출력해야 OCR을 바로 적용 가능합니다. 지난 북스캔 포스트에서 소개한 것처럼 문서 크기는 사용자 지정 크기를 권장하고, 세로줄 감소를 선택합니다.

ScanSnap Home 자세한 설정ScanSnap Home 자세한 설정


파일 형식에서 검색 가능한 PDF로 변환을 선택해야 OCR 이 적용된 문서로 저장됩니다. 스캔 탭에서 회전하지 않음을 선택하고, 빈 페이지 제거 기능을 비활성화합니다. 상세 옵션에서 문자를 선명하게 하는 옵션과 자동 기울기 조정을 선택합니다.

스캔하기

설정이 완료되면 스캔 창에서 Scan 버튼을 눌러 스캔합니다. 제가 테스트를 해보니 스캔하는 동안 OCR 작업이 거의 동시에 끝나는 것처럼 느껴집니다. 테스트를 위해 흑백 타입의 책 20페이지만 스캔하였습니다.

스캔 창에서 스캔 실행스캔 창에서 스캔 실행

스캔 결과

위의 설정으로 스캔을 하면 OCR 이 적용된 PDF가 출력됩니다. 아래 그림은 출력된 PDF의 내용을 드래그하여 메모장에 복사한 결과입니다. 띄어쓰기는 잘 인식하지 못하지만, 글자는 모두 잘 인식한 것을 확인하였습니다. PDF의 보세요 글자를 확대 봐도 디스플레이 장치로 보았을 때 전혀 문제가 없는 수준으로 보입니다.

OCR 결과 보기OCR 결과 보기


개인적인 후기

무료로 제공되는 번들이라 큰 기대를 하지 않았는데, 띄어쓰기는 잘 인식하지 못했지만, 글자인식률은 높다고 판단됩니다. 무엇보다 스캔하는 시간 동안 바로 OCR을 할 수 있다는 것이 가장 큰 장점으로 생각됩니다.

위 파일 크기 옵션에서 압축률이 낮은 옵션을 선택했는데, 낮음을 선택한 결과와도 체감적으로 차이가 크게 느껴지지 않습니다. 


마무리

이번 포스트에서 무료로 제공되는 ABBYY FineReader 로 스캔하면서 OCR 이 적용된 PDF를 생성하는 법에 대해 소개하였습니다. 다음 포스트는 이번 포스트에서 소개한 방법과 Acrobat DC로 OCR 한 결과를 비교할 예정입니다.

끝까지 읽어 주셔서 감사합니다.😄



댓글
댓글쓰기 폼
최근에 올라온 글
«   2020/10   »
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Total
21,965
Today
190
Yesterday
595