OCR Test Youn Se-hyo Youn Se-hyo 2013
목차 Test OCR engine Type Tesseract-ocr engine Result Tesseract-ocr engine Conclusion ABBYY finereader Result ABBYY finereader Conclusion Youn Se-hyo 2013
Test OCR engine Type Tesseract-ocr ABBYY finereader 각 실험 이미지는 전처리 보정 X Google에서 제공하는 Open source Open source중에서 유일하게 한글 ocr 지원 ABBYY finereader ABBYY사에서 개발한 소프트웨어 가장 뛰어난 성능을 가지고 있음 각 실험 이미지는 전처리 보정 X Youn Se-hyo 2013
Tesseract-ocr engine Result Test Image – 97 samples Character in test image – 417 samples Recognized Character – 172 samples Rate – 41.25% Youn Se-hyo 2013
Tesseract-ocr engine Result Good Image Bad Image Youn Se-hyo 2013
Tesseract-ocr engine Conclusion - 한글로 설정 할 경우 영문, 특수문자 인식 X - 왜곡(각도)에 매우 민감 - Good Image와 Bad Image가 이미지에서는 큰 차이는 안보이나 결과에서 차이가 있는 것으로 보아 학습데이터 정보에서 차이가 있는 것으로 보임 Youn Se-hyo 2013
ABBYY finereader Result Test Image – 104 samples Recognized Image – 91 samples Rate – 87.50% Character in test image – 405 samples Recognized Character – 349 samples Rate – 86.17% Youn Se-hyo 2013
ABBYY finereader Result Youn Se-hyo 2013
ABBYY finereader Conclusion - 한글, 영문, 특수문자 혼합 이미지도 인식 - 인식률 매우 높음 - 선명하다고 판단되는 이미지가 인식 안될 때 있음 - Tesseract에 비해서 아주 성능이 뛰어남 Youn Se-hyo 2013