업스테이지, 차세대 OCR 모델 공개…빅테크에 벤치마크 앞서

업스테이지가 정확하고 빠르게 문서를 분석해 대규모 언어 모델(LLM)로 처리가 가능한 차세대 광학문자인식(OCR) 모델 ‘도큐먼트 팔스(Document Parse)’를 17일 공개했다.

다큐먼트 팔스는 기존 OCR 기술에서 명확한 인식이 어려웠던 여러 열의 레이아웃이나 테이블을 포함한 복잡한 문서에서도 구조와 정보를 정확히 분석해 데이터 자산화를 지원한다.

어떤 형식의 문서도 HTML과 같은 구조화된 텍스트 형식으로 전환해 기업이나 기관에서 실제 LLM 활용 시 바로 적용할 수 있다는 설명이다.

업스테이지 관계자는 “검색증강생성(RAG) 시스템 성능과 LLM의 응답 정확도를 결정하는 핵심 요소인 데이터 전처리 과정에서의 정확성을 높일 수 있다”며 “속도와 사용성 측면에서도 현재 가장 진보한 형태의 처리 기술”이라고 강조했다.

(자료=업스테이지)

벤치마크 결과에서도 미국 빅테크를 앞섰다. 문서 구조 분석 성능평가 도구인 DP-벤치에 따르면 도큐먼트 팔스는 구글, 마이크로소프트, 아마존, 메타 등의 OCR 툴보다 5% 이상 높은 점수를 받았다.

또한 DOCX, PDF, PPTX, PNG 등 업무에 사용하는 9종의 문서 처리뿐만 아니라 수식 인식, 이미지 추출과 같은 기능을 추가했다.

김성훈 업스테이지 대표는 “도큐먼트 팔스는 각 기업이 가진 기존 문서를 가장 정확하게 자산화시켜 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구”라며,“다양한 비즈니스에서 활용되어 업무 혁신을 현실화할 것”이라고 밝혔다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

[컨퍼런스] AI 에이전트와 지능형 인터페이스 시대

◎ 일시 : 2025년 3월 27일 오후 12:30 ~
◎ 장소 : 서울 강남구 테헤란로7길 22 ST Center (과학기술컨벤션센터) 지하 1층 대회의실 2

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다