한글과컴퓨터는 경기도청, 한국전력공사, BGF리테일 등 주요 기관 및 기업과 디지털 전환 관련한 MOU를 체결하고 수십 곳과 AI 제품 실증사업(PoC)을 진행하며 괄목할 만한 성과를 거두고 있다고 18일 밝혔다. PoC는 한컴어시스턴트, 한컴피디아, 한컴데이터로더 등 한컴의 AI 제품들을 각 기관의 특성에 맞춰 최적화하는 사업이다. 업무 효율성 증대와 리소스 절감, 데이터 품질 향상 등 다양한 측면에서 뚜렷한 성과를 보여주고 있다. 실제로 PoC를 진행 중인 유통 기업에서는 한컴피디아를 통해 영업 관리자와 MD 간의 업무 효율성이 획기적으로 높아졌다. 기존의 Q&A 게시판에서 이루어지던 질의응답을 AI가 자동화함으로써 반복 업무가 줄어들고 실시간 피드백이 가능해졌다. 한 공공기관은 한컴피디아를 활용해 인사·노무 규정 및 업무 매뉴얼 확인 프로세스를 혁신적으로 개선했다. 임직원이 자연어로 질문하면 AI가 즉시 관련 규정에 관한 답변을 제공하는 방식으로, 특히 신규 입사자의 업무 적응을 크게 돕고 있다. 한컴피디아는 검색 증강 생성(RAG) 기술을 활용해 고객사의 내부 문서만을 기반으로 답변을 생성해 환각 현상이 없다는 것이 특징이다. 이처럼 한컴은 A
PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷으로 변환 가능 한글과컴퓨터(이하 한컴)가 PDF 문서에서 AI 데이터를 추출하는 소프트웨어 개발 키트(SDK) ‘한컴 데이터 로더’를 출시하고 본격적인 글로벌 B2B 세일즈에 나선다. 최근 세계 AI 업계에서는 LLM(대규모 언어모델)의 단점인 ‘환각 현상’을 최소화하는 해결책으로 ‘검색 증강 생성(RAG)’ 기술이 떠오르고 있다. RAG는 특정 데이터베이스나 문서 집합으로부터 관련 정보를 검색한 뒤 그 정보를 LLM에 적용해 적절한 답변으로 텍스트를 생성하므로 실시간으로 정보가 업데이트되며 정보의 정확도가 높은 것이 특징이다. 그 때문에 많은 글로벌 기업과 기관이 RAG의 도입을 원하지만, 구조화되지 않은 문서에서는 데이터 추출이 어려운 실정이다. 따라서 기업의 방대한 문서를 AI가 학습하기 좋은 형태로 데이터화하는 전처리 기술이 중요해졌다. 한컴은 지난 35년간 축적한 문서 기술을 바탕으로 문서의 AI 데이터화를 위한 전처리 기술을 모듈화해 ‘한컴 데이터 로더’라는 SDK 제품을 내놓았다. 대표적인 전자문서 형식인 PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷(JSON·CSV·TXT·