라인은 세계 최대 규모의 음성∙음향∙신호처리 학술대회인 ICASSP 2023에서 논문 8편이 채택됐다고 밝혔다. 올해로 48회차를 맞이하는 ICASSP(International Conference on Acoustics, Speech, and Signal Processing)는 국제전기전자협회 신호처리학회(IEEE Signal Processing Society)가 주최하는 음성∙음향∙신호처리 분야 내 세계 최대 규모의 국제학회다. 채택된 논문 8편 중 6편은 라인이 주저자로, 해당 학회에 채택된 라인이 주저자인 논문 수는 지난해 3편에서 두 배 늘어나는 성과를 거뒀다. 2편은 다른 저자와 공동 집필한 논문이며, 모두 학회 개최 기간인 6월 4일부터 10일 중 발표된다. 이번 ICASSP 2023에서 채택된 논문에는 감정 음성 합성 시 텍스트에서 음성 파형으로 변환하는 과정에서 음성 피치 정보(음성 높이)를 이용하는 엔드투엔드 모델에 관한 제안이 소개됐다. 기존 모델은 보다 풍부한 표현을 필요로 하는 감정 음성 합성 시 자연스러운 음성을 합성하기 어려운 사례가 많았으나, 변환 과정을 단일 모델로 수행하는 엔드투엔드 모델은 양질의 음성을 생성할 수 있다. 제안
오랄 포함 4편 논문 발표 진행하며 글로벌 AI 기술력 입증 카카오엔터프라이즈가 19일 인공지능(AI) 음성 처리 분야 세계 최대 규모 학술대회인 인터스피치에서 총 4편의 연구 성과를 발표한다고 밝혔다. 올해로 23회를 맞은 인터스피치는 18일부터 오는 22일까지 인천 송도 컨벤시아에서 진행된다. 카카오엔터프라이즈를 포함해 세계 유수의 AI 기업이 모여 최신 연구 성과를 공유하면서 전 세계 AI 업계의 이목이 집중되고 있다. 카카오엔터프라이즈는 이번 인터스피치에 플래티넘 스폰서로 참여했으며, 총 4편의 논문을 통해 사람 처럼 말하고 이해하는 AI를 선보였다. 이중 한 편은 인터스피치 등재 논문 중에서도 높은 수준을 인정받아 구두 발표로 공개됐다. 카카오엔터프라이즈는 실용적인 AI에 집중하며 글로벌 기술력을 다양한 서비스로 연결시키는 연구에 많은 투자를 하고 있다. 2019년 카카오에서 분사한 이래로 3년 연속 인터스피치에서 논문을 발표해왔으며 올해 까지 총 8편에 달하는 논문 성과를 공개했다. 이번 연구도 사람처럼 말하는 AI, 긴 음성도 잘 이해하는 AI, 인간의 복잡한 감정을 이해하는 AI 등 실제 서비스화할 수 있는 기술과 더불어 영어 발음이 원어민과
음성처리 등 4개 분야…연간 30명씩 5년간 육성 계획 KT는 1일부터 한국과학기술원(KAIST), 포항공대(포스텍), 한양대와 협업해 개설한 KT 채용 연계형 인공지능(AI) 전일제 석사과정 신입생을 모집한다고 밝혔다. KT는 지난해 한양대와 AI 인재 양성을 위한 협약을 맺고 올해 3월 이 과정을 개설했다. 이어 KAIST·포스텍과도 협력해 내년 3월부터 총 3개 대학에서 같은 과정을 운영할 예정이다. 모집 분야는 ▲음성처리 ▲자연어처리 ▲그래픽스·컴퓨터비전 ▲머신러닝·딥러닝 등 4개다. 선발은 서류 전형과 인적성·코딩검사, 실무·임원 면접 등을 거쳐 진행된다. KT는 AI 석사과정 프로그램에 선발된 학생들에게 재학 기간 대학원 입학금을 포함한 등록금 전액을 비롯해 연구 지원비를 지급한다. 포스텍의 경우 원거리 학생들을 위한 기숙사도 제공한다. KT는 이 프로그램을 통해 연간 총 30명 규모, 5년간 150여 명의 AI 전문인력을 육성할 계획이다. 석사과정 신입생 모집은 이달 23일 마감되며, 선발 절차 등에 대한 자세한 내용은 KT 채용 홈페이지를 참고하면 된다. 신현옥 KT 경영지원부문장(부사장)은 "디지털플랫폼 기업으로 도약하는 KT가 국내 유수 대
자연어 처리, 음성 처리 분야서 두각 드러내며 세계 상위권으로 등극 카카오엔터프라이즈가 지난 19일 2022년 상반기 인공지능(AI) 분야 탑티어 글로벌 학회에서 논문 17건을 등재했다고 밝혔다. 카카오엔터프라이즈는 자연어 처리, 음성 처리, 컴퓨터 비전 분야를 아우르는 연구 성과를 발표했고, 이번 해에는 새롭게 강화학습, 지식그래프 분야에서도 논문을 발표하며 국가대표 AI 기술 기업으로서의 입지를 강화했다. 카카오엔터프라이즈는 이중 자연어 처리, 음성 처리 분야에서 특히 두각을 나타내며 사람 처럼 말하고 감정을 인지하는 AI를 선보였다. 카카오엔터프라이즈는 자연어 처리 분야 세계 최고 학회인 NAACL에서 기존 사전학습 언어모델을 대화 속 감정을 추출하는 데에 활용하는 방법론을 발표했다. 최근 자연어 처리 분야에서는 대화 속 감정을 인식하기 위해 상식이나 감정에 대한 외부지식을 이용한 방식이 활용되고 있다. 하지만 비영어권 언어에서는 영어에 비해 축적된 사전지식이 적기 때문에 이 방식을 그대로 적용하기 어렵다는 문제가 있다. 카카오엔터프라이즈는 이를 해결할 새로운 방법론을 제안하며 한국어에서 외부지식에 의존하지 않고도 감정 인식에서 높은 성능을 낼 수 있음