
KAIST가 연합학습(Federated Learning)의 고질적인 성능 저하 문제를 해결하고, AI 모델의 일반화 성능을 획기적으로 향상시킨 새로운 학습 방법을 개발했다. 이번 연구는 병원·은행 같은 보안이 중요한 분야는 물론, 소셜미디어·온라인 쇼핑처럼 변화가 잦은 환경에서도 안정적인 성능을 발휘하며, 인공지능 협업의 새 가능성을 보여줬다.
KAIST는 산업및시스템공학과 박찬영 교수 연구팀이 연합학습의 한계를 극복할 수 있는 새로운 학습 방식을 제시했다고 15일 밝혔다. 이번 연구는 ‘데이터 프라이버시를 지키면서도 협업 가능한 AI’를 구현한 것으로 평가받고 있다.
연합학습은 여러 기관이 데이터를 직접 공유하지 않고도 AI를 공동 학습할 수 있는 방식이다. 그러나 이렇게 만들어진 공동 AI 모델을 각 기관 환경에 맞게 최적화하는 과정에서, 특정 기관의 데이터 특성에만 과도하게 적응하는 ‘지역 과적합(Local Overfitting)’ 문제가 꾸준히 제기돼왔다.
예를 들어 여러 은행이 함께 구축한 ‘공동 대출 심사 AI’를 특정 은행이 대기업 고객 데이터를 중심으로 재학습시키면, 그 은행의 AI는 대기업 심사에는 강하지만 개인이나 스타트업 고객 심사에는 약해지는 문제가 생기는 식이다.
박찬영 KAIST 산업및시스템공학과 교수 연구팀은 이를 해결하기 위해 ‘합성 데이터(Synthetic Data)’ 방식을 도입했다. 각 기관의 실제 데이터에서 대표적 특징만 추출해 개인정보를 포함하지 않는 가상 데이터를 만들어내고, 이를 학습 과정에 활용함으로써 각 기관의 AI가 개별 환경에 맞게 최적화되면서도 공동 모델의 폭넓은 지식을 유지하도록 했다.
이 방법을 적용한 결과, 의료·금융 분야처럼 데이터 보안이 중요한 환경에서 특히 높은 효율성을 보였으며, 소셜미디어·전자상거래처럼 데이터가 빠르게 변화하는 분야에서도 안정적인 성능을 유지했다. 또한 새로운 기관이 연합학습에 참여하거나 데이터 특성이 급격히 변하더라도 AI 성능이 흔들리지 않고 일관성을 유지하는 것으로 나타났다.

박찬영 KAIST 산업및시스템공학과 교수는 “이번 연구는 데이터 프라이버시를 지키면서도 각 기관의 AI가 전문성과 범용성을 동시에 확보할 수 있는 길을 연 것”이라며 “의료 AI나 금융 사기 탐지 AI 등, 협업이 필수적이지만 보안이 중요한 분야에서 실질적인 도움이 될 것”이라고 말했다.
이번 연구는 데이터사이언스대학원 김성원 학생이 제1 저자, 박찬영 교수가 교신저자로 참여했으며, 지난 4월 싱가포르에서 열린 인공지능 분야 최고 권위 학회 ‘국제표현학습학회(International Conference on Learning Representations, ICLR) 2025’에서 상위 1.8%의 우수 논문만 선정되는 구두 발표 대상으로 채택되어 그 우수성을 인정받았다.
한편, 이번 연구는 정보통신기획평가원의 ‘강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습’ 과제와 한국연구재단의 ‘그래프 파운데이션 모델: 다양한 모달리티 및 도메인에 적용 가능한 그래프 기반 기계 학습’ 과제, ‘데이터사이언스융합인재양성 사업’의 지원을 받아 수행됐다.
헬로티 이창현 기자 |