배너
닫기
배너

“내 얼굴 안 올려도 지브리풍으로”...UNIST, 콘텐츠 생성 AI 개발

URL복사

 

‘셀카’와 같은 개인정보가 포함된 민감 데이터를 서버로 직접 보내지 않고도 고품질 이미지 등 콘텐츠 생성을 돕는 인공지능(AI) 모델을 울산과학기술원(UNIST) 연구진이 개발했다.

 

UNIST 인공지능대학원 유재준 교수팀은 연합학습 AI 모델인 ‘프리즘’(PRISM·PRivacy-preserving Improved Stochastic Masking)을 개발했다고 9일 밝혔다.

 

유 교수팀에 따르면 연합학습이란 민감 데이터를 직접 서버에 올리지 않고 각자 장치의 ‘로컬 AI’가 학습을 수행한 뒤 그 결과만을 모아 서버에 전달함으로써 하나의 ‘글로벌 AI’를 만드는 기술이다. 프리즘은 연합학습 과정에서 로컬 AI와 글로벌 AI를 연결하는 학습 중재자 역할을 하는 AI 모델이다.

 

최근 오픈AI의 새 이미지 생성 모델을 이용해 일본 애니메이션 제작사 지브리의 화풍으로 사진 바꾸기가 유행하고 있는데, 셀카를 지브리 화풍으로 바꾸려면 사진을 서버에 올려야 하기 때문에 개인정보 침해 우려가 있다.

 

반면 프리즘을 이용하면 모든 처리가 스마트폰 안에서 이뤄져 사생활 침해를 막고 결과도 빠르게 받아볼 수 있는 것이다. 단 스마트폰에서 이미지를 직접 생성하는 로컬 AI 모델 개발은 별도로 필요하다. 프리즘은 기존 다른 모델과 비교해 통신 비용을 평균 38%, 크기를 48% 줄인 1-bit 수준의 초경량형이다. 스마트폰, 태블릿 PC 등 소형 장비의 중앙처리장치(CPU)나 메모리에도 부담 없이 작동한다.

 

또 로컬 AI마다 데이터와 성능의 편차가 큰 상황에서도 어떤 로컬 AI의 정보를 더 믿고 반영할지를 정확하게 판단하고 조율해 최종 생성물의 품질이 높다고 연구진은 설명했다. 연구진이 실제 AI 성능 검증에 쓰이는 데이터 세트인 MNIST, FMNIST, CelebA, CIFAR10 등으로 실험한 결과, 기존 방식보다 통신량은 적으면서도 이미지 생성 품질은 더 높게 나타났다.

 

연구진은 모든 정보를 공유하는 대용량 파라미터 방식 대신 중요 정보만 선별해 공유하는 이진 마스크 방식을 적용해 통신 효율을 높였고, 생성 품질을 정밀하게 평가하는 손실 함수와 각 로컬 AI의 기여도를 다르게 집계하는 전략으로 데이터 편차와 학습 불안정성을 해소했다.

 

유재준 교수는 “이미지뿐만 아니라 텍스트 생성, 데이터 시뮬레이션, 자동 문서화 등 다양한 생성 AI 분야에 적용할 수 있다”며 “의료, 금융 등 민감 정보를 다루는 분야에서 효과적이고 안전한 설루션이 될 것”이라고 말했다.

 

이번 연구 결과는 세계 3대 AI 학회인 ‘ICLR(The International Conference on Learning Representations) 2025’에서 발표된다. 연구는 과학기술정보통신부 한국연구재단, 정보통신기획평가원, UNIST 슈퍼컴퓨팅센터의 지원을 받아 이뤄졌다.

 

헬로티 이창현 기자 |









배너









주요파트너/추천기업