이파피루스, 표 인식 대폭 강화된 AI OCR ‘텍스트센스 2.0’ 출시
상태바
이파피루스, 표 인식 대폭 강화된 AI OCR ‘텍스트센스 2.0’ 출시
  • 윤현기 기자
  • 승인 2022.10.04 14:47
  • 댓글 0
이 기사를 공유합니다

문서 속 표 부분만 자동 인식…엑셀 파일 제공
키워드 검출 기능으로 원하는 정보만 찾아내 빠르게 OCR 가능…업무 효율 대폭 증가
이파피루스 텍스트센스로 표 문서 OCR을 진행한 모습
이파피루스 텍스트센스로 표 문서 OCR을 진행한 모습

[데이터넷] 전자문서·데이터 기술 전문 기업 이파피루스(대표 김정희)는 표 문서 인식 기능을 대폭 강화한 인공지능 문자인식(AI OCR) 솔루션 ‘텍스트센스 2.0(TextSense 2.0)’을 출시했다고 4일 밝혔다.

‘텍스트센스’는 흐리거나 오염/손상된 문서도 정확하게 읽어내는 인공지능 OCR 솔루션이다. 이번 업그레이드의 핵심은 ‘표 인식 기능’으로, 인식 대상 문서 내에 있는 표를 자동으로 찾아 텍스트 데이터로 추출해 준다. 표 구조와 내용 그대로 엑셀 파일(.xlsx)로 다운로드할 수도 있다.

이파피루스 최고운영책임자(COO) 김정아 부사장은 “기존 OCR은 표 안에 있는 구조에 대한 정보 없이 텍스트만 인식하는 것이 고작이었고, 표에 병합된 셀이 하나라도 들어있으면 텍스트 순서가 흐트러져 사람이 일일이 후처리를 해야 했다”며 “‘텍스트센스 2.0’은 표의 행과 열 순서 파악은 물론, 병합된 셀 구조까지 분석해 원본 표 형태 그대로 정확하게 읽어내므로 이러한 후작업을 대폭 줄여준다”고 말했다.

원하는 데이터만 빠르게 뽑아낼 수 있는 ‘키워드 검출 기능’도 추가됐다. 일반 줄글 문서 속에서 특정 키워드를 포함한 줄을 모두 찾아 주거나, 표 안에서 원하는 단어가 있는 행 또는 열만 찾아내 준다. 예를 들어 인적 사항을 수집한 표에서 ‘010-’으로 시작하는 전화번호가 있는 열만 찾아 데이터로 추출할 수 있는 것.

문서 내에서 가로 세로 위치를 지정해 해당 위치에 있는 텍스트만 읽어내는 것도 가능하다. 사업자등록증, 통장사본 등 일정 양식을 가지고 있는 문서에서 사업자등록번호, 예금주 등 특정 정보만 필요로 할 때 특히 유용한 기능으로, 전체 문서를 OCR하는 기존 방식보다 시간 또한 대폭 절약된다.

김정아 부사장은 “단순히 종이 문서 전체를 ‘잘 읽기만’ 하면 됐던 1차원적인 OCR의 시대는 이미 지나간 지 오래다. 오늘날 비즈니스 현장에서 필요로 하는 것은 데이터 선별과 분류까지 도와주는 솔루션”이라며 “‘텍스트센스 2.0’은 정확한 텍스트 인식은 물론 표 인식과 키워드 검출 기능으로 그간 OCR 후 수정 및 데이터 분류 작업에 필요했던 많은 시간과 수고를 덜어줄 수 있는 획기적인 제품”이라고 자신감을 드러냈다.

‘텍스트센스 2.0’은 이파피루스 데모 페이지에서 누구나 체험할 수 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.