바로가기 메뉴
본문 바로가기
주메뉴 바로가기

사전 BMT(성능)

 

SW 정의

 OCR(Optical Character Recognition)은 인쇄되거나 손으로 쓴 텍스트를 광학적 수단을 통해 컴퓨터가 인식할 수 있는 텍스트 데이터로 변환하는 과정을 의미한다. 소프트웨어 관점에서는 텍스트가 포함된 이미지를 텍스트 데이터로 변환하는 것으로 정의할 수 있으며, 유형 정합(pattern matching), 획 분석법(stroke analysis method), 필기 문자 인식(handwritten character recognition) 등의 전통적인 기법을 활용한 OCR 제품군뿐만 아니라 AI기술을 활용한 ICR(Intelligent Character Recognition) 제품군도 포함될 수 있다. 최근에는 기술발전으로 인해 손글씨, 행정문서, 고문서, 영상 내 텍스트 분석 등 다양한 분야 및 서비스에 활용되고 있다.
 

  관련 용어 :  OCR, ICR, 광 문자 인식, 문자 인식, 지능형 문자 인식


평가모델

 최근 5개년(2018~2022) 간 공공 구매사업에서 발주기관들의 주요 요구사항을 분석하여 인식률(분류성능) 중 정밀도(Precision)와 재현율(Recall)을 평가지표로 설계하였다.
입력 이미지로부터 대상제품이 출력한 인식 텍스트와 정답지의 정답 텍스트 간 최장공통부분수열(Longest Common Subsequence, LCS)을 참긍정(True Positive)로 정의하고, 이를 기준으로 거짓긍정(False Positive), 거짓부정(False Negative) 등의 오탐을 식별하여 각 평가지표를 산출한다.

 ※ 세부 평가항목은 수행계획서 참고

시험환경

     시험수행 기준
       대상제품이 설치되는 서버의 운영체제를 리눅스 OS로 설계하여 시험을 수행하였다.​​​​​​​​

     시험환경
       명시적으로 설계된 제품뿐만 아니라 인공지능 모델을 활용한 제품의 원활한 평가를 위해 GPU 사용이 가능한 서버를 구축하였다.​​ 

     ※ 세부 시험환경은 수행계획서 참고  

수행계획

다운로드

수행현황 리스트

검색

총 게시물 4

번호, 구분, 제목, 첨부파일, 등록일, 조회가 나타나 있는 목록
NO. 연도 평가시험환경 업체명 제품명 결과서
4 2022 정형서식_인쇄체 ㈜사이냅소프트 Synap OCR Pro v2.0 결과서 첨부파일
3 2022 공공행정문서 ㈜사이냅소프트 Synap OCR Pro v2.0 결과서 첨부파일
2 2022 자유형식_손글씨 ㈜로민 문서인식OCR 솔루션 텍스트스코프 v1 결과서 첨부파일
1 2022 공공행정문서 ㈜로민 문서인식OCR 솔루션 텍스트스코프 v1 결과서 첨부파일
개발에 필요한 img tag입니다.