악어디지털 AI OCR ‘칸다’, 필기체 인식률 개선
상태바
악어디지털 AI OCR ‘칸다’, 필기체 인식률 개선
  • 윤현기 기자
  • 승인 2021.06.24 11:11
  • 댓글 0
이 기사를 공유합니다

문서 인식 정확도 99.34% 달해…비정형 데이터도 오류 없이 인식 가능

[데이터넷] 인공지능(AI) 기반 문서전자화 서비스 기업 악어디지털(대표 김용섭)은 AI-OCR 기술 ‘KANDA(칸다)’로 필기체 인식률을 개선했다고 24일 밝혔다.

악어디지털에서 자체적으로 개발한 칸다는 기존 300여 고객사의 다양한 문서처리 경험을 바탕으로 개발된 AI-OCR(인공지능 광학문자판독) 기술이다. 난이도 높은 문서도 99.34%의 인식 정확도를 자랑한다.

AI에 기반해 스스로 품질을 평가하고 다시 학습하는 과정으로 인해 작업 시간이 짧고 정확도가 높다. 신규 문서 서식에 대한 엔진 성능을 지속적으로 유지할 수 있도록 메인 서버의 학습데이터로 문자 인식률을 추론한 뒤 인식률이 저조한 데이터에 대해서는 사람이 다시 교정한다.

즉 필기체 같은 비정형 문자나 명도 차이가 큰 흑백문서, 구겨지거나 왜곡된 문서, 표와 글씨가 겹쳐 있는 문서를 전자화 하는데도 막힘이 없다.

특히 한글과 한자 약 600만자와 일본어 약 120만자의 필기체에 대해 자가 생성 학습 기술을 적용한 분야별 용어집을 바탕으로 스스로 필체를 생성하고 습득하는 것이 특징이다.

이 외에도 고객사 전용 특화 학습 엔진과 서버를 별도로 운영해 기존의 업무 효율성을 높일 수 있는 연계 서비스까지 한 번에 제공하는 장점을 갖고 있다.

김용섭 악어디지털 대표는 “칸다는 악어디지털이 다수의 기업과 공공기관의 문서를 전자화하면서 얻은 노하우를 총망라한 AI-OCR 기술”이라며 “신뢰성 높은 OCR 기술로 자리매김할 수 있도록 계속해서 노력할 계획이다”고 전했다.

한편 지난 2014년 문서 전자화 O2O 서비스 제공 기업으로 출발한 악어디지털은 AI-OCR, RPA 기반 BPO(업무처리 아웃소싱) 서비스를 제공하는 회사로 자리매김했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.