SW 정의
OCR(Optical Character Recognition)은 인쇄되거나 손으로 쓴 텍스트를 광학적 수단을 통해 컴퓨터가 인식할 수 있는 텍스트 데이터로 변환하는 과정을 의미한다. 소프트웨어 관점에서는 텍스트가 포함된 이미지를 텍스트 데이터로 변환하는 것으로 정의할 수 있으며, 유형 정합(pattern matching), 획 분석법(stroke analysis method), 필기 문자 인식(handwritten character recognition) 등의 전통적인 기법을 활용한 OCR 제품군뿐만 아니라 AI기술을 활용한 ICR(Intelligent Character Recognition) 제품군도 포함될 수 있다. 최근에는 기술발전으로 인해 손글씨, 행정문서, 고문서, 영상 내 텍스트 분석 등 다양한 분야 및 서비스에 활용되고 있다.
관련 용어 : OCR, ICR, 광 문자 인식, 문자 인식, 지능형 문자 인식
평가모델
최근 5개년(2018~2022) 간 공공 구매사업에서 발주기관들의 주요 요구사항을 분석하여 인식률(분류성능) 중 정밀도(Precision)와 재현율(Recall)을 평가지표로 설계하였다.
입력 이미지로부터 대상제품이 출력한 인식 텍스트와 정답지의 정답 텍스트 간 최장공통부분수열(Longest Common Subsequence, LCS)을 참긍정(True Positive)로 정의하고, 이를 기준으로 거짓긍정(False Positive), 거짓부정(False Negative) 등의 오탐을 식별하여 각 평가지표를 산출한다.
※ 세부 평가항목은 수행계획서 참고
시험환경
시험수행 기준 대상제품이 설치되는 서버의 운영체제를 리눅스 OS로 설계하여 시험을 수행하였다.
시험환경 명시적으로 설계된 제품뿐만 아니라 인공지능 모델을 활용한 제품의 원활한 평가를 위해 GPU 사용이 가능한 서버를 구축하였다.
※ 세부 시험환경은 수행계획서 참고