ABBYY FlexiCapture

  • home >
  • 솔루션 >
  • ABBYY FlexiCapture
  • 주요 기능

    ABBYY FlexiCapture 10 은 지능형 데이터 및 문서 캡처 솔루션입니다. ABBYY FlexiCapture 10 은 단일 솔루션으로 혼재 되어 있는 여러 종류의 서식 문서를 자동으로 분류할 수 있고, 정형, 비정형 양식에 관계 없이 데이터 추출을 수행하여, 비즈니스 어플리케이션이나 데이터베이스로 데이터 내보내기를 할 수 있습니다. ABBYY FlexiCapture 10 은 문서 분류와 데이터 입력에 투입되는 리소스와 시간을 효과적으로 절감할 수 있습니다 .
    ABBYY FlexiCapture 10은 비교적 적은 양에서부터 방대한 양의 문서 처리에도 대응할 수 있도록 확장성을 고려하여 설계되어 있으며, 다음과 같이 어떤 종류의 서식도 처리할 수 있습니다
    • 정형 서식(fixed forms): 각종 가입 신청서, 신고서, 설문지, 시험 답안지와 같이 문서 포맷과 데이터의 위치가 동일한 서식
    • 비정형 문서 (semi-structured documents): 견적서, 발주서, 신용카드 매출전표, 병원 진료비, 약제비 등의 영수증과 같이 추출할 데이터의 종류와 구조는 정해져 있지만, 발행기관 마다 서로 양식이 달라 데이터의 위치와 포맷, 크기가 다른 경우
    • 일반 문서 (unstructured documents): 각종 공문, 기사, 계약서와 같이 문서의 구조가 상이한 문서
    ABBYY FlexiCapture 10의 문서 처리 흐름은 크게 4 단계 (Import, Recognition, Verification, Export)를 거치게 되며, 그 결과 문서 이미지의 서식 분류, 문자 인식, 데이터 교정/대사 과정이 완료되어, 정확하고 검색 가능한 형태의 구조화된 데이터로 저장되어, 개별 부서나 전체 조직의 비즈니스에 사용됩니다
    ABBYY FlexiCapture는 어떤 복잡도의 문서 처리라도 커스터마이즈할 수 있는 강력한 툴을 제공합니다. 표준 문서 처리 흐름도 변경할 수 있는 확장성을 제공합니다.

    Importing (이미지 불러오기)

    ABBYY FlexiCapture 10은 다양한 TWAIN, ISIS, WIA 방식을 지원하는 다양한 범위의 스캐너를 지원합니다. 또한 다음과 같은 방식을 통해 문서 이미지를 불러 올 수 있습니다:
    • 감시 폴더 (로컬 또는 LAN 상의 공유 폴더)
    • FTP 서버
    • Microsoft® Exchange 또는 POP3 메일 서버 이메일 첨부
    이미지 불러오기 작업은 미리 설정해 놓은 Import Profile을 통해 자동화할 수 있습니다
    또한 업무 프로세스가 여러 지역 또는 지사에서 처리해야 하는 경우를 위해 원격 스캔 프로그램과 웹 방식 스캔 인터페이스를 제공합니다.

    Recognition (인식)

    인식 단계에서는 이미지 전처리와 문서 분류, 데이터 추출 (OCR, ICR), 데이터 유효성 검사 규칙 등을 수행합니다. 모든 작업은 서버에서 오퍼레이터 없이 자동화 할 수 있습니다.
    이미지 전처리 - 최고의 인식 품질을 얻기 위해 다음과 같은 작업을 수행합니다.
    • 이미지 방향 자동 보정 (90, 180, 270도) 
    • 역상 보정
    • 흑백 영상으로 이진화
    • 기울기 보정
    • 잡영 (노이즈) 제거

    문서자동분류

    FlexiCapture는 문서 서식을 자동으로 식별하고, 한 페이지 또는 여러 페이지로 구성된 문서를 구분하는 고급 기술을 제공합니다.
    FlexiCapture의 문서 자동 분류 기술은 다음과 같이 복잡한 구조의 문서들도 분류해 낼 수 있습니다 :
    • 한 페이지 또는 여러 페이지 문서
    • 페이지 수가 가변적인 문서
    • 여러 페이지에 걸친 표를 포함하는 문서
    • 첨부 이미지를 포함하는 문서
    Classifier 훈련 기능을 사용하면 좀더 편리하게 문서 분류 템플릿을 구현할 수 있습니다. Classifier는 이미지 사이의 유사도를 자동으로 검출하여, 미지의 이미지가 속한 문서 유형을 파악해 낼 수 있습니다.

    데이터 인식 및 텍스트 추출

    한글을 포함해 세계 최고 인식률을 자랑하는 ABBYY 인식 엔진을 사용하여 정확한 데이터 인식을 수행합니다.
    FlexiCapture의 문서 자동 분류 기술은 다음과 같이 복잡한 구조의 문서들도 분류해 낼 수 있습니다 :
    • 한글/한자, 중국어, 일본어, 히브리어를 포함한 전세계 190개 언어 인쇄체 인식 (OCR)
    • 한국인 필체 영,숫자를 포함한 전세계 110국어 필기체 인식(ICR: intelligent character recognition)
    • 다양한 형태의 체크 마크 인식 (OMR)
    • 1D, 2D 바코드 인식
    • OCR-A, OCR-B, MICR 금융권 폰트 인식
    데이터 필드의 인식 속성은 대화 상자에 마우스 클릭을 통해 누구나 쉽게 설정할 수 있습니다. 영,숫자의 경우 사용자 훈련으로 인식률을 높일 수 있습니다.

    데이터 유효성 확인

    FlexiCapture는 인식 결과에 오류가 없음을 보장하기 위한 다양한 규칙을 제공하며, 인식 과정이 끝나면 자동으로 유효성 검사가 수행되며, 다음과 같은 기능을 제공합니다:
    • 데이터베이스 참조
    • 데이터 포맷 체크
    • 필드 간 합계 또는 동일 값 교차 체크
    • 스크립트 언어를 사용한 커스텀 체크

    Verification (검증)

    검증은 인식 결과를 사람이 육안으로 확인하여 필요 시 텍스트 및 문서 분류에 발생할 수 있는 오류를 보정하는 단계입니다. 검증 속도를 높이고 검증 절차를 단순화하기 위해 FlexiCapture는 여러 가지 효과적이고도 사용하기 쉬운 사용자 인터페이스를 제공하며, 웹 브라우저를 사용한 검증도 가능합니다. 검증은 전체 프로세스를 자동화 하는 경우 건너 뛸 수 있는 단계로, 이 경우 인식이 끝나면 바로 내보내기가 실행됩니다. 인식된 데이터와 문서 이미지는 다음과 같은 방식으로 내보낼 수 있습니다.

    Export (인식결과 내보내기)

    인식된 데이터와 문서 이미지는 다음과 같은 방식으로 내보낼 수 있습니다.
    • 파일 (엑셀, CVS, 이미지 파일, PDF/PDF/A)
    • 외부 데이터베이스 (ODBC 사용)
    • Microsoft SharePoint 2003/2007/2010
    • ERP, ECM/DMS 등의 비즈니스 시스템 (스크립트 언어를 이용)