AI 비큐AI RDP 1, 글로벌 RAG 평가서 고득점...뉴스 AI 기술 입증
LLM 기반 뉴스 서비스 상용화 신뢰성 강화하는 모델로 주목 비큐AI가 개발한 뉴스 특화 LLM+RAG 모델 ‘RDP 1’이 국제 평가 프레임워크인 RAGAS(RAG Assessment Scores)에서 전 항목 평균 0.9 이상, 일부 항목에서는 0.95에 달하는 높은 평가를 받으며 기술적 완성도를 공식 입증했다. 최근 비공개 베타 테스트(CBT)를 마무리한 RDP 1은 사실 기반 뉴스 응답의 정확성과 신뢰성을 자동으로 검증받은 첫 사례 중 하나로, LLM 기반 뉴스 서비스 상용화의 신뢰성을 강화할 수 있는 모델로 주목된다. RAGAS는 생성형 AI 모델이 문서 기반 질문에 대해 얼마나 정확하고 관련성 있는 응답을 생성하는지를 평가하는 오픈소스 프레임워크다. 기존 BLEU, ROUGE 등 텍스트 생성 지표가 담보하지 못했던 사실성(Factuality)과 응답의 맥락 일치도(문맥성)를 정량적으로 분석할 수 있다는 점에서 Microsoft, AWS, Meta, OpenAI 등 글로벌 빅테크 기업들이 RAG 시스템의 성능 검증 수단으로 채택하고 있다. RAGAS는 생성 응답의 충실성, 질문-응답 간 관련성, 문맥 내 정답 위치 정확도, 문맥 내 정답 정보 포괄성