비큐AI가 자사 뉴스 검색증강생성(RAG) 모델 ‘RDP1’이 글로벌 신뢰도 평가 지표인 RAGAS(Retrieval-Augmented Generation Assessment)에서 업계 평균을 크게 웃도는 성과를 기록했다고 29일 밝혔다. 이번 결과는 RAG 시스템의 성능뿐 아니라 실제 산업 현장에서의 적용 가능성을 보여주는 지표로 평가된다. 비큐AI는 이번 2차 RAGAS 평가에서 RDP1이 문맥 정확도 1.0000점, 문맥 회수율 0.9689점, 사실성 0.9287점 등 전 항목에서 0.9 이상의 점수를 획득했다고 설명했다. 특히 문맥 정확도 만점은 질문에 대해 검색된 문서가 정확히 핵심 정보를 담고 있음을 보여주는 결과로, 검색 및 청킹 전략의 정교화가 성능 향상에 실질적 영향을 미쳤다는 것을 입증한다. 이 모델은 벤치마크 기준으로 업계 상위 5~10% 수준의 고성능 RAG 시스템으로 평가되며, RAG 기반 AI 시스템의 기술적 성숙도를 보여줬다는 평가를 받고 있다. RAGAS는 마이크로소프트, AWS, 메타, 오픈AI 등 글로벌 빅테크들이 활용하는 신뢰도 검증 지표로, 검색 문서의 품질과 생성 답변의 사실성을 함께 평가하는 것이 특징이다. 비큐AI는
광고 캠페인 기획이나 콘텐츠 아이데이션 같은 반복적·정형화한 작업에 어울려 더에스엠씨가 자체 개발한 AI 에이전트를 도입하며 본격적인 AI 전환에 나섰다. 이번 AI 에이전트는 외부 파트너 없이 전사적으로 독립 개발된 것으로, 광고 실무 환경에 최적화된 구조를 갖췄다는 점에서 업계의 주목을 받고 있다. 더에스엠씨의 AI 에이전트는 범용 LLM과 사내 특화형 에이전트를 통합한 형태로, 기획·제작 등 실무 핵심 업무를 자동화하고 지원하는 것이 핵심 기능이다. 특히 수만 건에 달하는 자사 내부 레퍼런스 데이터를 실시간으로 검색·요약하는 탐색형 시스템을 기반으로, 광고 캠페인 기획이나 콘텐츠 아이데이션 같은 반복적·정형화된 작업에 최적화해 있다. 사용자는 질의응답 기반 인터페이스를 통해 필요한 정보를 즉시 확보할 수 있으며, 외부 LLM이나 웹 검색과도 연동이 가능해 보다 풍부한 인사이트를 얻을 수 있다. 이에 실무자는 반복 업무에서 벗어나 전략적 기획과 창의적 사고에 집중하게 된다. 이번 AI 시스템은 올해 초 새롭게 개편된 사내 연구 조직 ‘AI Labs’를 통해 전 과정이 자체 설계됐다. AI Labs는 광고업계 특화 검색증강생성(RAG) 구조를 중심으로 정보
LLM 기반 뉴스 서비스 상용화 신뢰성 강화하는 모델로 주목 비큐AI가 개발한 뉴스 특화 LLM+RAG 모델 ‘RDP 1’이 국제 평가 프레임워크인 RAGAS(RAG Assessment Scores)에서 전 항목 평균 0.9 이상, 일부 항목에서는 0.95에 달하는 높은 평가를 받으며 기술적 완성도를 공식 입증했다. 최근 비공개 베타 테스트(CBT)를 마무리한 RDP 1은 사실 기반 뉴스 응답의 정확성과 신뢰성을 자동으로 검증받은 첫 사례 중 하나로, LLM 기반 뉴스 서비스 상용화의 신뢰성을 강화할 수 있는 모델로 주목된다. RAGAS는 생성형 AI 모델이 문서 기반 질문에 대해 얼마나 정확하고 관련성 있는 응답을 생성하는지를 평가하는 오픈소스 프레임워크다. 기존 BLEU, ROUGE 등 텍스트 생성 지표가 담보하지 못했던 사실성(Factuality)과 응답의 맥락 일치도(문맥성)를 정량적으로 분석할 수 있다는 점에서 Microsoft, AWS, Meta, OpenAI 등 글로벌 빅테크 기업들이 RAG 시스템의 성능 검증 수단으로 채택하고 있다. RAGAS는 생성 응답의 충실성, 질문-응답 간 관련성, 문맥 내 정답 위치 정확도, 문맥 내 정답 정보 포괄성