AI 전문기업 바이브컴퍼니는 13일 서울 한남동 본사에서 생성AI 선도인재양성사업 2025년도 성과공유회를 열고 산학협력을 통해 추진한 2년차 연구성과를 공개했다고 밝혔다. 과학기술정보통신부와 정보통신기획평가원이 주관하는 생성AI 선도인재양성 사업은 2027년까지 총 145억 원 규모의 예산이 투입되는 국가 연구개발 사업이다. 바이브컴퍼니는 2024년 주관기관으로 선정돼 고려대, 서울대, 국민대, 연세대 등과 함께 생성AI 기반 응용 기술과 인재양성 연구를 진행해왔다. 이번 성과공유회에서는 바이브컴퍼니의 사업 운영성과, 대학별 연구 성과, 내년도 계획 발표 등이 진행됐다. 고려대학교 연구팀은 멀티모달 모델의 환각 문제를 개선한 Tri-layer Contrastive Decoding 기술을 선보였다. 이 기술은 모델 내부 층별 인식 특성을 조정해 추가 학습 없이도 사실 기반 정확도를 향상시키는 방식으로, 글로벌 벤치마크 POPE, MME, AMBER에서 정확도 최대 10% 향상, 환각률 최대 38% 감소 성과를 기록했다. 또한 자연어처리 분야 최고 권위 학회인 EMNLP 2025에 채택되며 연구 성과를 인정받았다. 서울대학교는 통계정보 검색 및 시각화 기술을,
S2W가 대규모언어모델(LLM) 토큰화 구조의 근본적 취약점을 규명한 연구 성과로 세계 최고 권위 자연어처리 학회인 ‘자연어처리방법론학회(EMNLP) 2025’에 논문을 등재했다. 이번 논문은 S2W와 한국과학기술원(KAIST) 공동 연구팀이 진행했으며 비영어권 언어에서의 토크나이저 구조적 한계를 분석해 AI 환각(Hallucination) 현상의 원인을 규명했다. EMNLP는 ‘전산언어학학회(ACL)’와 ‘북미전산언어학학회(NAACL)’와 함께 자연어처리(NLP) 분야의 세계 3대 학술대회로 꼽힌다. S2W는 이번 성과를 통해 4년 연속 세계 최고 권위 AI 학회에 논문을 등재하게 됐다. 앞서 2022년 다크웹 언어 연구, 2023년 다크웹 도메인 특화 언어모델 ‘다크버트(DarkBERT)’, 2024년 사이버보안 문서 특화 언어모델 ‘사이버튠(CyBERTuned)’ 관련 연구를 통해 NAACL과 ACL에서 논문을 발표한 바 있다. 이번에 채택된 논문 ‘Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers(바이트 레벨 토크나이저 내 불완전 토큰의 취약점을