OCR 결과 비교 : ABBYY FineReader TM 5.5 vs Acrobat DC
ScanSnap IX1500에서 무료로 제공되는 ABBYY FineReader for ScanSnap(TM 5.5)와 유료로 사용하는 Acrobat DC의 OCR 과정과 결과를 비교
하였습니다. 프로그램의 선택에 참고해주세요.옵션 비교
ScanSnap Home 옵션
ScanSnap Home에서 ABBYY FineReader TM 5.5 를 사용하여 PDF를 만들고 OCR 하는 과정과 이미지로 스캔하여 Acrobat DC에서 스캔하는 과정 자체가 달라 동일한 조건으로 비교할 수 없어 최대한 가능한 옵션으로 진행하였습니다.
ABBYY FineReader 와 Acrobat DC OCR 비교를 위한 ScanSnap 옵션 비교
최종 결과 파일 용량 비교를 위해 ABBYY FineReader 는 파일 크기 3가지 옵션으로 진행하였습니다. 아래의 ScanSnap 옵션에서 압축률 3가지 옵션입니다. ABBYY FineReader 만 3가지 진행한 이유는, 경험적으로 Acrobat DC 의 OCR 결과가 압도적으로 용량이 적을 것이라 예상해서 이렇게 비교하였습니다.
파일 크기 옵션
📌 ScanSnap IX1500 으로 세부 설정하는 법이 알고 싶으신 분은 이전 포스트를 참고해주세요.
Acrobat DC OCR 옵션
- 출력 : 편집 가능한 텍스트 및 이미지 (구 Acrobat Pro의 ClearScan)
- 샘플링 : 300dpi
결과 비교
용량 비교 : Acrobat DC Win 압도적
용량은 스캔하는 책의 이미지에 따라 달라지는 부분이기 때문에, 상대적인 수치만 확인하시면 됩니다. 테스트를 위해 사진이 없는 흑백의 책 20page (10장)을 스캔 후 비교하였습니다. 결과는 책에 따라 다른 옵션 환경에 따라 당연히 달라질 수 있습니다.
- JPG to PDF 원본 : 19.8 MByte
- Acrobat DC OCR 결과 : 1.2 MByte
- ABBYY FineReader for Scansnap - 압축률 낮음 : 7.7 MByte
- ABBYY FineReader for Scansnap - 압축률 보통 : 10.4 MByte
- ABBYY FineReader for Scansnap - 압축률 높음 : 19.8 MByte
속도 및 작업 편의성 : ABBYY 압도적
- ABBYY FineReader for ScanSnap : ScanSnap 에서 스캔하면서 OCR
- Acrobat DC OCR
- JPG로 스캔 (PDF로도 가능함)
- JPG to PDF 생성
- 생성된 PDF 파일 OCR 작업 - 시간이 많이 소요됨
출력 화면 : 취향의 문제
최종 결과 출력 화면 비교
개인이 태블릿 또는 PC 화면에서 책을 볼 용도라면, ScanSnap 의 내장 기능으로 OCR 할 때 파일 크기는 낮음으로 설정하는 것이 효율적입니다.
OCR 결과 비교
FineReader 와 Acrobat 모두 글자 인식률은 높아서 PDF에서 검색 기능을 사용하는 경우 비슷한 수준으로 검색이 가능할 것 같습니다. Acrobat은 띄어쓰기까지 잘 인지하는 것을 확인하였습니다.
Acrobat이 띄어쓰기가 잘되어서 훨씬 더 좋다고 말하기는 애매한 부분이 있습니다. 만약 PDF 내에서 검색 기능을 주로 사용한다면 ABBYY 가 더 좋으리라 생각되고, PDF의 내용을 복사해서 자료를 만들어야 하는 경우 Acrobat이 더 좋습니다. 이건 사용하는 활용도에 따라 장단점이 됩니다.
OCR 결과 비교
요약
디테일하게 출력화면과 OCR 결과 차이가 있지만, OCR 방식 선택의 주요한 포인트는 아래와 같습니다. 선호도에 따라 북스캔 OCR 프로그램을 선택하는 데 도움이 되었으면 합니다. 장단점이 너무 극명하게 나뉘어집니다.
- ABBYY FineReader for ScanSnap : 무료, 북스캔 작업 속도를 아주 단축하지만 최종 파일의 용량이 크다.
- Acrobat DC : 유료, 북스캔 작업 절차가 번거롭지만, 최종 파일의 용량이 적다.
끝까지 읽어 주셔서 감사합니다.😄
'Productivity > BookScan' 카테고리의 다른 글
ScanSnap IX1500 으로 ABBYY FineReader TM 5.5 를 사용하여 스캔하면서 OCR 하기 (4) | 2020.09.17 |
---|---|
Fujitsu ScanSnap IX500 사용자 무료 ABBYY FineReader TM 5.5 설치 방법 (0) | 2020.09.17 |
북스캔 #6 PDF 만들기 및 OCR 하기 by Acrobat Pro DC (0) | 2020.09.16 |
북스캔 #5 DarkNamer 로 파일명 일괄 변경 및 책의 페이지 구조 (0) | 2020.09.15 |
북스캔 #4 스캔하기 - ScanSnap IX1500 스캔 설정 및 유의 사항 (2) | 2020.09.15 |