티스토리 뷰

Productivity/BookScan

ABBYY FineReader TM 5.5 vs Acrobat DC OCR 결과 비교

좁고 얕은 지식 Yongmini 2020. 9. 17. 02:34

북스캔 OCR 비교북스캔 OCR 비교

OCR 결과 비교 : ABBYY FineReader TM 5.5 vs Acrobat DC

이번 포스트에서는

ScanSnap IX1500에서 무료로 제공되는 ABBYY FineReader for ScanSnap(TM 5.5)와 유료로 사용하는 Acrobat DC의 OCR 과정과 결과를 비교

하였습니다. 프로그램의 선택에 참고해주세요.

옵션 비교

ScanSnap Home 옵션

ScanSnap Home에서 ABBYY FineReader TM 5.5 를 사용하여 PDF를 만들고 OCR 하는 과정과 이미지로 스캔하여 Acrobat DC에서 스캔하는 과정 자체가 달라 동일한 조건으로 비교할 수 없어 최대한 가능한 옵션으로 진행하였습니다. 

ABBYY FineReader 와 Acrobat DC OCR 비교를 위한 ScanSnap 옵션 비교ABBYY FineReader 와 Acrobat DC OCR 비교를 위한 ScanSnap 옵션 비교


최종 결과 파일 용량 비교를 위해 ABBYY FineReader 는 파일 크기 3가지 옵션으로 진행하였습니다. 아래의 ScanSnap 옵션에서 압축률 3가지 옵션입니다. ABBYY FineReader 만 3가지 진행한 이유는, 경험적으로 Acrobat DC 의 OCR 결과가 압도적으로 용량이 적을 것이라 예상해서 이렇게 비교하였습니다.

파일 크기 옵션파일 크기 옵션

📌 ScanSnap IX1500 으로 세부 설정하는 법이 알고 싶으신 분은 이전 포스트를 참고해주세요.


Acrobat DC OCR 옵션

  • 출력 : 편집 가능한 텍스트 및 이미지 (구 Acrobat Pro의 ClearScan)
  • 샘플링 : 300dpi


결과 비교

용량 비교 : Acrobat DC Win 압도적

용량은 스캔하는 책의 이미지에 따라 달라지는 부분이기 때문에, 상대적인 수치만 확인하시면 됩니다. 테스트를 위해 사진이 없는 흑백의 책 20page (10장)을 스캔 후 비교하였습니다. 결과는 책에 따라 다른 옵션 환경에 따라 당연히 달라질 수 있습니다. 

  • JPG to PDF 원본 : 19.8 MByte
  • Acrobat DC OCR 결과 : 1.2 MByte
  • ABBYY FineReader for Scansnap - 압축률 낮음 : 7.7 MByte
  • ABBYY FineReader for Scansnap - 압축률 보통 : 10.4 MByte
  • ABBYY FineReader for Scansnap - 압축률 높음 :  19.8 MByte
위 결과와 같이 Acrobat DC OCR 결과가 압도적으로 좋습니다.


속도 및 작업 편의성 : ABBYY 압도적

작업 속도 및 편의성은 ScanSnap 으로 내장 기능으로 ABBYY FineReader 를 사용하여 스캔하면서 OCR 하는 방식이 압도적으로 좋습니다. 스캔하는 시간 동안 OCR이 함께 된다고 느낄 정도 입니다. OCR을 위한 처리 시간을 느끼지 못했습니다. 색체가 많은 사진의 경우는 어떨지 해보지 않아 모릅니다.
  • ABBYY FineReader for ScanSnap : ScanSnap 에서 스캔하면서 OCR
  • Acrobat DC OCR
    • JPG로 스캔 (PDF로도 가능함)
    • JPG to PDF 생성
    • 생성된 PDF 파일 OCR 작업 - 시간이 많이 소요됨


출력 화면 : 취향의 문제

최종 결과 파일의 출력 화면은 아래와 같습니다. ABBYY를 사용하여 OCR 한 경우 파일 크기를 낮음으로 설정해도 보는데 아무런 문제가 없습니다. Acrobat DC로 OCR 한 결과는 원본의 글자와 다르지만, 글자 내부를 진하게 표시하여 글자 윤곽이 잘 드러납니다. 아래와 같이 출력되는 화면은 취향의 선택에 따라 달라질 수 있습니다. 저는 Acrobat DC와 같이 왜곡이 조금 있어도 진한 폰트가 눈에 더 잘 띄어서 Acrobat 결과를 더 선호합니다. 

최종 결과 출력 화면 비교최종 결과 출력 화면 비교

개인이 태블릿 또는 PC 화면에서 책을 볼 용도라면, ScanSnap 의 내장 기능으로 OCR 할 때 파일 크기는 낮음으로 설정하는 것이 효율적입니다.

OCR 결과 비교

FineReader 와 Acrobat 모두 글자 인식률은 높아서 PDF에서 검색 기능을 사용하는 경우 비슷한 수준으로 검색이 가능할 것 같습니다. Acrobat은 띄어쓰기까지 잘 인지하는 것을 확인하였습니다. 

Acrobat이 띄어쓰기가 잘되어서 훨씬 더 좋다고 말하기는 애매한 부분이 있습니다. 만약 PDF 내에서 검색 기능을 주로 사용한다면 ABBYY 가 더 좋으리라 생각되고, PDF의 내용을 복사해서 자료를 만들어야 하는 경우 Acrobat이 더 좋습니다. 이건 사용하는 활용도에 따라 장단점이 됩니다.

OCR 결과 비교OCR 결과 비교


요약

디테일하게 출력화면과 OCR 결과 차이가 있지만, OCR 방식 선택의 주요한 포인트는 아래와 같습니다. 선호도에 따라 북스캔 OCR 프로그램을 선택하는 데 도움이 되었으면 합니다. 장단점이 너무 극명하게 나뉘어집니다.

  • ABBYY FineReader for ScanSnap : 무료, 북스캔 작업 속도를 아주 단축하지만 최종 파일의 용량이 크다.
  • Acrobat DC : 유료, 북스캔 작업 절차가 번거롭지만, 최종 파일의 용량이 적다.

끝까지 읽어 주셔서 감사합니다.😄

댓글
댓글쓰기 폼
최근에 올라온 글
«   2020/10   »
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Total
21,965
Today
190
Yesterday
595