한국과학기술원(KAIST)은 전기·전자공학부 노용만 교수 연구팀의 박세진 박사과정생이 장시간 음성 생성이 가능한 음성언어모델(SLM·Spoken Language Model) ‘스피치SSM’을 개발했다고 3일 밝혔다. 이번 연구는 권위 있는 국제머신러닝학회(ICML) 논문 중 1%만 받을 수 있는 구두 발표 대상으로 선정됐다. SLM은 대형언어모델(LLM)과 달리 텍스트가 아닌 음성을 학습함으로써 텍스트에 담을 수 없는 사람의 억양·감정 등 비언어적 정보까지 이해해 정보를 생성하는 기술이다. 텍스트 기반 언어 모델의 한계를 넘어서는 차세대 기술로 주목받고 있지만, 장시간 일관된 음성을 생성하기 어려워 팟캐스트, 오디오북, 음성비서 등에는 적용하기 어려웠다. 음성 정보를 담기 위해 ‘음성 토큰’(음성을 잘게 쪼갠 데이터) 형태로 만드는데, 음성 토큰이 많아질수록 고해상도를 유지하기 위한 메모리 소비가 급증하기 때문이다. 앞의 정보를 집중해 기억하는 메모리의 길이에 한계가 있어, 장시간 이용할 경우 주제의 일관성이 무너지는 문제가 있었다. 연구팀은 최근 정보에 집중하는 ‘어텐션 층’(attention layer)에 전체 이야기의 흐름, 즉 장기적인 맥락을 오래 기
휴머노이드 로봇 핸드 ‘델토 그리퍼-5F’ 비롯 3지 그리퍼 신제품 ‘델토 그리퍼-3F’ 선봬 강화·모방학습 기반 로봇 핸드 기술력 강조해 테솔로가 이달 24일부터 닷새간 싱가포르에서 개막하는 ‘제13회 표현학습국제학회(International Conference on Learning Representations 2025 이하 ICLR 2025)에 등판했다. ICLR은 인공지능(AI)·딥러닝(Deep Learning)·머신러닝(Machine Learning) 분야 글로벌 학회로, 뉴립스(NeurIPS)·국제머신러닝학회(ICML)와 함께 글로벌 3대 AI 학회로 손꼽힌다. 매년 연구기관·기업 등 AI 분야 주체가 참여해 최신 연구 동향을 공유하고, 이를 심사해 우수 논문을 선정한다. 테솔로는 이번 학회에서 자체 개발 휴머노이드 로봇 핸드 ’델토 그리퍼-5F(Delto Gripper-5F, DG-5F)’를 전시했다. 이 모델은 지난 3월 휴머노이드 로봇 시장을 겨냥해 사람의 손과 유사한 수준의 높은 자유도(DoF) 기반 인간형 5지 솔루션으로 데뷔했다. 다양한 산업용·협동로봇과 호환 가능한 로봇팔 말단장치(End-Effertor)다. 개발자 모드 지원를 지원하고