사이냅소프트가 디딤365와 AI 사업 협력을 위한 업무협약(MOU)을 체결했다고 19일 밝혔다. 이번 협약을 통해 양사는 ‘사이냅 도큐애널라이저’와 ‘DidimVSM’ 솔루션을 연계해 상호 시너지를 극대화할 계획이다. 특히 안전하고 신뢰성 있는 RAG 구축을 위한 기술개발 및 사업 개발에 협력하기로 했다. 사이냅 도큐애널라이저는 LLM학습데이터 구축과 디지털 문서 자산화를 위한 솔루션이다. 아래아 한글, 오피스 문서, PDF등의 일반 업무용 문서와 이미지 문서 등 다양한 비정형 문서의 포맷과 레이아웃, 속성 및 객체를 분석해 정보화 한다. 또한 표, 도형 같은 시각적 정보와 제목, 문단, 머리글/바닥글, 캡션, 각주, 페이지 번호와 같은 문서 구조 정보를 Markdown, XML 형식의 정형 데이터로 전환한다. 디딤365의 DidimVSM은 대규모 언어 모델(LLM)의 성능을 강화하기 위한 솔루션이다. 데이터 수집/전처리/청킹/임베딩/벡터 DB 적재까지 모든 과정을 자동화해 LLM 서비스의 성능 개선을 위한 RAG(검색증강생성)를 쉽고 빠르게 구성할 수 있도록 지원한다. 전경헌 사이냅소프트 대표는 “최근 생성형 AI 시스템에서는 데이터의 질이 더욱 중요해지고
사이냅소프트가 문서분석 솔루션 ‘사이냅 도큐애널라이저’의 고도화된 기능을 27일 공개했다. 이번 업데이트는 문서 내 다양한 요소를 정확하게 분석하고, 사용 편의성을 대폭향상시킨 것이 특징이다. 사이냅소프트는 업데이트를 통해 단순한 텍스트 분석을 넘어 차트, 도형, 이미지, 수식 등 복잡한 문서 요소까지 아우르는 통합적인 분석 솔루션을 제공한다고 전했다. 특히 문서 내 이미지 추출 기능은 연구 및 데이터 분석 분야에서 큰 활용 가치를 지닐 것으로 기대된다. 새롭게 추가된 이미지 추출 기능은 문서 내 포함된 이미지들을 별도의 파일로 추출할 수 있도록 한다. 기존에는 복잡한 과정을 거쳐야 했던 이미지 추출 작업이 단 몇 번의 클릭만으로 가능해졌다. 이 기능을 통해 연구자나 데이터 분석가는 차트나 수식이 포함된 이미지 정보를 보다 쉽게 활용할 수 있게 되어, 필요한 정보를 신속하게 확보하고 분석 시간을 단축할 수 있게 된다. 뿐만 아니라 제목 및 캡션 인식 기능은 문서의 구조를 명확하게 파악할 수 있도록 돕는다. 이는 사용자가 문서의 맥락을 빠르게 이해하고 원하는 정보를 정확하게 찾는데 결정적인 역할을 한다. 더불어 페이지 내 읽기 순서 인식은 좌표 정보를 기반으로
사이냅소프트는 AI 기반 OCR 솔루션 ‘사이냅 OCR’의 웹팩스와 복합기 적용이 증가하고 있다고 6일 밝혔다. 사이냅 OCR은 이미지나 스캔된 문서의 문자를 정확하게 인식하고 추출하는 AI OCR 솔루션이다. TTA를 통해 99.3%의 높은 한글 인식률과 우수한 데이터 추출 성능을 인증 받았으며 GS인증 및 ICT기술마켓인증 등 다양한 품질인증도 보유하고 있다. 또한 비정형 학습도구인 ‘키밸류 트레이너(KVT)’와 고객이 직접 새로운 서식을 등록할 수 있는 ‘폼메이커’를 제공하고 있어, 서비스 확장 시 유연하게 대응하고 비용 부담을 최소화할 수 있다. 최근에는 AI학습을 통한 KVT 서식 분류 기능과 서식인식 결과를 확인하고 검증할 수 있는 대사 페이지 등을 개선해 정기 업데이트 릴리즈를 진행했다. AI OCR은 팩스 문서와 스캔 이미지에서 텍스트를 자동으로 인식해 수작업 입력을 없애고 업무 효율성을 향상시킨다. 개인정보를 포함한 민감정보 필터링 및 마스킹 처리 기능으로 보안도 강화되며 높은 인식률과 정확성으로 문서 디지털화 과정에서 오류를 줄이고 정보 신뢰성을 높인다. 전경헌 사이냅소프트 대표는 “사이냅 OCR은 국내 시장에서 100개 이상의 레퍼런스를
사이냅소프트는 미소정보기술과 ‘LLM 사업 협력을 위한 업무협약(MOU)’을 체결했다고 27일 밝혔다. 이번 협약을 통해 양사는 ‘사이냅 도큐애널라이저’와 스마트TA 기반 ‘M(MISO)-LLM’ 솔루션을 연계해 시너지를 창출할 계획이다. 사이냅소프트의 사이냅 도큐애널라이저는 LLM 학습데이터 구축과 디지털 문서 자산화를 위한 솔루션이다. 아래아 한글, Office 문서, PDF등의 일반 업무용 문서와 이미지 문서 등 다양한 비정형 문서의 포맷과 레이아웃, 속성 및 객체를 분석해 정보화한다. 또한 표, 도형, 그래프와 같은 시각적 정보와 제목, 문단, 머리글·바닥글, 캡션, 각주, 페이지번호와 같은 문서 구조 정보를 Markdown, XML 형식의 정형 데이터로 전환한다. 미소정보기술의 스마트TA기반 M-LLM은 방대한 데이터분석과 머신러닝 기반 사용자가 지정한 속성에 대한 카테고리 별 다중 속성 분류, 향상된 언어 규칙(Advanced Linguistic Rule)을 이해한 의미 기반의 속성 분류 솔루션 ‘스마트TA’에 sLLM을 결합한 솔루션이다. M-LLM은 매개변수의 수를 줄이고 검색증강생성(RAG)과 미세조정(FINE-TUNING)을 통해 기업과 기