메인라인, AI 기술 전문기업으로 발돋움…AI OCR 관련 기술 특허 획득
상태바
메인라인, AI 기술 전문기업으로 발돋움…AI OCR 관련 기술 특허 획득
  • 강석오 기자
  • 승인 2024.01.24 10:13
  • 댓글 0
이 기사를 공유합니다

메인라인 최현길 대표와 특허증

[데이터넷] IDP(Intelligent Document Processing, 지능형문서처리) 전문기업 메인라인(대표 최현길)은 AI OCR 관련 기술을 통해 특허를 획득함에 따라 AI 기술 전문기업으로 발돋움하는 기반을 마련했다고 밝혔다.

메인라인이 취득한 특허 기술은 ‘딥러닝 기반 이종의 OCR AI 알고리즘을 이용해 최적 텍스트를 인식하는 장치, 방법 및 사용자 단말(특허 제 10-2619368호)’이다.

OCR은 광학을 이용해 인식된 텍스트와 기 저장된 텍스트 데이터 간 비교를 통해 글자를 판독하는 기술이다. 기존 OCR 기술은 로직, 패턴, 알고리즘 등 PC용 솔루션을 통해 글자를 인식할 수 있었지만, 최근 AI 기술 발전에 따라 머신러닝, 딥러닝 등을 활용해 스캔된 이미지를 분석함으로써 자동으로 글자를 인식할 수 있게 됐다.

그러나 OCR AI에는 다양한 신경망 알고리즘이 이용되며, 이용되는 알고리즘에 따라 텍스트 인식 결과가 각각 다르게 도출되는 문제점을 가지고 있다. 메인라인은 이를 해결하기 위해 이미지 데이터에 적용할 최소 둘 이상의 알고리즘을 포함한 텍스트 인식 엔진을 이용하여, 보다 정확한 텍스트 인식 결과를 도출하도록 했다.

이종의 OCR AI 알고리즘을 이용하여 각각의 후보 텍스트를 도출하고, 도출된 각각의 후보 텍스트를 기 학습된 강화학습모델에 입력한 후 최종 텍스트를 도출함으로써, 높은 정확도의 텍스트 인식 결과와 최적의 텍스트 인식율을 제공할 수 있도록 한 것이다.

이를 통해 한글 이미지 데이터의 경우 다양한 용어, 어순, 문장에 대해 점검을 수행하고, 단어의 정확한 텍스트 추출이 우선적으로 수행되었는지를 검증한 후 수정을 통해 최종 텍스트를 도출할 수 있다. 예를 들어, 진료비 영수증의 경우 '청구명세서', '검사료', '진찰료', '비급여' 등의 용어를 ‘건강보험심사평가원’의 ‘진료비청구명세서’의 요양 기관별, 종별의 용어에 기초하여 수정할 수 있다.

또한 해당 특허 기술은 각각의 후보 텍스트 및 사용자 규칙 정보를 강화학습모델에 입력하여 상태(state)를 인식하고, 인식된 상태로부터 리워드(Reward) 함수를 만족하는 행동(Action)을 도출하도록 강화학습모델을 학습시킬 수도 있다.

따라서 진료비 영수증이나 사업자등록증, 공공기관 문서 등 텍스트를 포함하고 있는 다양한 이미지 데이터를 보다 정교하게 텍스트로 인식해, 더욱 수준 높은 IDP 기술을 의료, 엔터프라이즈, 공공 등 폭넓은 산업 분야에 적용할 수 있게 됐다.

최현길 메인라인 대표는 “메인라인은 국내 대표 IDP 리딩 기업으로서 선행 기술 R&D에 앞장서고 있으며, 향후 텍스트 및 이미지를 활용한 AI 기술 분야로 진출을 위해 기술 경쟁력을 계속해서 확보해 나갈 것”이라고 밝혔다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.