테크노트 KAIST 한인수 교수팀, AI 모델 메모리 6배 압축 기술 세계 최초 공개
AI 성능을 오랫동안 제약해온 '메모리 병목' 문제가 차세대 알고리즘으로 돌파구를 찾았다. KAIST(총장 이광형) 전기및전자공학부 한인수 교수가 참여한 구글 리서치(Google Research)·딥마인드(DeepMind)·뉴욕대(New York University) 공동 연구팀이 AI 모델의 메모리를 최대 6배까지 줄이면서도 성능 저하를 거의 없앤 차세대 양자화 알고리즘 '터보퀀트(TurboQuant)'를 공개했다. AI 모델은 입력 데이터를 벡터 형태로 변환한 뒤 벡터 간 유사도를 계산하는 방식으로 작동하는데, 이 과정에서 고정밀(high-precision) 데이터를 사용하기 때문에 막대한 메모리 자원이 소모된다는 점이 고질적인 한계로 지적돼 왔다. 터보퀀트는 이러한 고정밀 데이터를 더 적은 비트로 압축하는 '양자화(quantization)' 기술을 핵심으로 한다. 소수점 데이터를 정수로 근사하는 방식으로 핵심 정보는 유지하면서 저장 용량과 연산 부담을 동시에 줄이는 원리다. 터보퀀트의 기술적 핵심은 두 단계로 나뉜다. 1단계에서는 입력 데이터를 무작위로 회전(Random Rotation)시킨 뒤 각 요소를 개별적으로 양자화해 데이터 내 극단값(outli