닫기
배너

사이냅소프트, 한국주택금융공사 RAG 시스템에 ‘도큐애널라이저’ 공급

URL복사

 

생성형 AI의 성능을 가르는 핵심 요소로 ‘데이터 품질’이 부상하면서 데이터 전처리 기술의 중요성이 더욱 커지고 있다. 글로벌 시장조사기관 마켓앤마켓에 따르면 AI 학습 데이터 세트 시장은 연평균 27.7% 성장해 2029년 95억 8천만 달러 규모에 이를 전망이다. 시장 확대와 함께 AI의 신뢰도와 정확성은 LLM 자체보다 학습 데이터의 품질에 달려 있다는 점이 부각되고 있다. 잘못된 데이터는 AI의 ‘환각 현상(Hallucination)’을 유발해 결과물의 신뢰도를 떨어뜨리기 때문이다.

 

이러한 흐름 속에서 사이냅소프트는 AI 문서 구조 분석 솔루션 ‘사이냅 도큐애널라이저’를 효율적으로 공급하고 있다. 이 솔루션은 원본 문서의 구조와 맥락을 분석해 AI가 이해하기 가장 적합한 형태로 데이터를 변환·정제하는 역할을 한다. 단순 텍스트 추출을 넘어 문서의 제목·표·이미지·단락 등 시각적 구성과 논리적 순서를 식별하는 정교한 시각적 구조 분석(VSA) 기술을 갖췄다. 분석된 데이터는 마크다운(MD), JSON 등 정형 데이터로 변환되어 맥락을 보존하면서 LLM 학습 효율을 극대화한다.

 

사이냅 도큐애널라이저는 이미 다양한 산업 현장에서 활용되고 있다. 최근 한국주택금융공사의 자체 검색 증강 생성(RAG) 시스템 구축 사업에 공급되어 HWP, PDF, 이미지 등 비정형 문서 분석을 지원했다. 공사는 주택보증, 보금자리론 등 업무 특성상 다양한 문서를 다루며 LLM이 문서 내용을 왜곡 없이 이해하도록 데이터 정제 과정을 핵심 조건으로 삼았다. 이외에도 삼성디스플레이, 한화시스템, 한국남부발전 등 국내 주요 기업이 도입해 신뢰성을 입증했다.

 

또한 사이냅소프트는 지난해 코난테크놀로지와 ‘LLM 사업 협력 MOU’를 체결하고 자체 LLM ‘코난 LLM’의 학습 데이터 정제·가공을 담당하고 있다. 이를 통해 국내 대표 AI 기술 기업들과의 협업을 확대하며 기술력을 검증받고 있다.

 

전경헌 사이냅소프트 대표는 “성공적인 LLM 프로젝트는 결국 얼마나 고품질의 학습 데이터를 확보하느냐에 달려있다”며 “한국주택금융공사 공급과 코난테크놀로지와의 협력은 사이냅 도큐애널라이저가 생성형 AI 신뢰도를 높이는 필수 솔루션임을 보여주는 중요한 이정표”라고 말했다. 이어 “앞으로도 기업과 기관의 성공적인 AI 전환(AX)을 이끄는 핵심 기술 파트너가 되겠다”고 전했다.

 

헬로티 구서경 기자 |









배너




배너





주요파트너/추천기업