종이로 있는 문서의 내용을 pc로 입력하려 할 때,
양이 적다면 즉시 타이핑하여 입력하겠지만 양이 많다면 얘기가 달라지죠.
저도 그래서 OCR프로그램을 찾게 되었는데요,
여기에서는 구글 드라이브의 OCR 기능과
레티아 ABBYY FineReader 를 같은 문서를 이용해 성능비교를 시도해 보았습니다.
우선 구글드라이브의 OCR 기능은 무료이고
레티아 ABBYY FineReader는 유료인데 하루에 10회까지는 무료서비스로 이용 가능합니다.
위가 레티아 ABBYY FineReader 의 무료서비스 화면 입니다.
위에 설명되어 있는대로 무료 서비스는 하루에 총 10회이고
1회 변환시 3페이지 이내라고 되어 있습니다.
구글드라이브의 OCR 기능은 제한 없는 무료인데요,
저는 평소 구글드라이브를 이용하고 있지 않고 있었기 때문에
이번 테스트를 위해 처음으로 사용해 보았습니다.
이번 테스트를 위해 사용한 문서는 한글도, 영문도 아닌 숫자 입니다.
전화번호부죠. 참고로 일반인은 아니고 자동차를 파시는 분들의 전화번호 입니다.
위와 같은 상태의 그림파일로 준비하기 위해 600dpi로 스캔하고 각도 맞추려고 0.1도 단위로 회전해주고
전화번호가 있는 부분만 잘라내어 모아다가 포토샵으로 새 그림을 만들어 놓았습니다.
사실 OCR프로그램에서 인식하게 하기 위해 여기까지 준비하는 과정도 손이 많이 가는 과정입니다.
OCR 소프트웨어를 이용하는것과 그냥 타이핑 하는게 과연..
효율면에서 의미있는 차이가 있을지 의문이네요ㅎㅎㅎ
구글드라이브의 OCR 기능을 이용하는 방법은 위와같이 구글드라이브에 사진을 올리구요,
올린 사진을 우클릭하여 '연결앱' - 'Google 문서' 기능을 선택합니다.
그럼 위와같이 원본이미지가 위에 있고 아래엔 위의 그림을 인식하여
텍스트로 생성된 전화번호들이 나옵니다.
레티아 ABBYY FineReader는 워드파일로 만들어서 지정된 메일로 보내주는데요,
위와 같이 날아왔습니다. 전화번호들이 겹쳐져서 보이기도 하지만
전체선택(Ctrl+a) 하여 메모장으로 옮기니면 (Ctrl+v)
구글드라이브에서처럼 텍스트로 되어있는 전화번호의 모습을 제대로 볼 수 있습니다.
그럼 비교해 보겠습니다.
위의 사진에서 왼쪽이 구글드랑이브OCR 기능을 이용한 것이고
오른쪽이 레티아 ABBYY FineReader로 인식시킨 것입니다.
둘 다 총 110개의 전화번호들을 모두 인식했습니다.
그런데 내용을 보니 조금 다르군요.
레티아 ABBYY FineReader는 전화번호 사이의 하이픈을 실제 하이픈으로 표기했는데요,
구글드라이브에서는 하이픈처럼 생겼지만 키보드상에 있는 하이픈이 아닌
다른 것을 사용해서 표기했습니다.
또한 ABBYY FineReader는 몇개 정도의 하이픈을 다른것으로 표시한 것 외엔
모두 정확하게 인식했지만 구글드라이브의 OCR 기능에서는
문서 중간중간에 실제로는 없는 점( . )이 다수 발견되었구요,
문서에 있는 숫자를 표시하지 않은 경우도 1건 있었습니다.
결론은 레티아 ABBYY FineReader의 승리입니다.
'컴퓨터' 카테고리의 다른 글
스마트폰 트로이 목마 바이러스 wfgbv.apk 주의하세요! (0) | 2016.08.31 |
---|---|
엑셀 - 셀서식을 이용해 같은 문자를 여러셀에 추가 입력하기 (0) | 2016.07.31 |
삭제된 파일 복구하기 - 언딜리트 (0) | 2016.02.08 |