배너
닫기

기획특집

배너

1가구 1 인공지능 홈 스피커 시대 곧 올까?

URL복사
[#강추 웨비나] 제조 산업을 위한 클라우드 활용 웨비나 시리즈 Autodesk 올인원 제조솔루션 Fusion 활용하기 - 1편: Fusion 소개 및 모델링 활용하기 (7/10)

[첨단, 헬로티]


2011년 애플이 스마트폰의 버튼 하나 누르지 않고 음성으로만 작동시키는 음성제어 기술인 ‘시리(Siri)’를 아이폰4S를 통해 선보였을 때, 우리는 기능의 편리함에 놀랍고 신기하기만 했었다. 인공지능 음성 제어 기술은 꾸준한 발전을 통해 ‘인공지능 음성 스피커’가 개발됐고, 이제는 우리의 집안 전체를 제어하고 작동시키고, 심지어 배달음식까지 주문시킬 수 있게 됐다. 인공지능 스피커 시장 현황과 이와 더불어 주목 받고 있는 인공지능 스피커의 핵심 반도체인 ‘MEMS 마이크로폰(MEMS Microphone)’의 기술 현황에 대해 알아보겠다. 또 음성 인식기반 스피커에 여러 솔루션을 공급하고 있는 텍사스인스트루먼트의 기술과 가트너의 ‘대화형 플랫폼’에 관한 의견을 들어본다.


Part 1. 국내 통신 3사 중심으로 인공지능 음성비서 스피커 경쟁 2차전


Part 2. 인공지능 음성 스피커 성장의 핵심 기술 ‘MEMS 마이크로폰’


Part 3. Interview - “TI의 토탈 솔루션 전략, 스마트 스피커 시장에도 통했다”


Part 4. Opinion - 2018년 10대 전략적 기술 동향 ‘대화형 플랫폼’






국내 통신 3사 중심으로 인공지능 음성비서 스피커 경쟁 2차전


몇 년 전 아이폰을 통해 스마트폰에 음성 기술이 선보여졌을 때, 우리가 물어보는 모든 질문에 대한 대답이 가능하지 않아 기술적 한계가 많았던 것이 사실이다. 무엇보다도 한국어 인식률이 떨어졌기 때문에 국내 사용자의 이용률이 낮았다. 그러나 최근 인공지능(AI) 기술의 비약적인 발전으로 음성 인식률이 높아지면서 음성제어 기술은 하이엔드 스마트폰의 주요 기능으로 자리 잡았고, 국내에서도 한국어에 최적화된 음성인식 기술 개발에 뛰어들면서 지난해부터 한국어에 최적화된 지능형 개인비서 스피커의 종류가 점차 다양해지고 있다.




인공지능 음성 비서 스피커 기술, IT 기업의 격전지로 부상 


음성 기반으로 지능형 개인비서(Intelligent Personal Assistant, IPA) 또는 가상개인비서(Virtual Personal Assistants, VPA)로 불리는 기술은 사용자와 소통하며 정보 또는 서비스를 맞춤형으로 제공하는 소프트웨어를 의미한다. 


지능형 개인비서 기술은 애플이 2011년 10월 iOS 5의 신규 기능으로 시리(Siri)를 탑재한 이후, 구글의 ‘구글 나우'(Google Now, 2012.7.), 마이크로소프트의 ‘코타나’(Cortana, 2014.4.), 페이스북의 ‘엠’(M, 2015.8.)이 각사 플랫폼을 기반으로 연이어 선보이고 있다. 구글나우와 코타나는 음성 기반, 엠은 텍스트 기반의 챗봇 형태로 구동된다는 점이 특징이다.


애플의 시리는 스마트폰 뿐 아니라 애플워치, 애플TV, 애플카플레이 등으로 영역을 확대하고 있으며, 주요 21개 언어를 서비스하고 있다. 구글의 어시스턴트는 2012년 안드로이드 OS4.1부터 적용되고 있으며, 안드로이드 기반 스마트폰과 웨어러블 기기에 탑재되고 있다. 


본격적인 스마트홈을 위한 지능형 개인비서 시장은 아마존이 2014년 11월 IPA ‘알렉사(Alexa)’ 기반의 거치형 브루투스 스피커 ‘에코(Echo)’ 시리즈를 출시한 이후 시작됐다. 구글은 2016년 5월 ‘구글 나우’의 업그레이드 버전인 ‘구글 어시스턴트’를 탑재한 구글홈(Google Home)을 발표하면서 스마트홈 스피커 시장에 진출했다. 마이크로소프트는 2016년 12월 음향 기기제조사인 하만카돈과 함께 AI 홈스피커를 공개했다. 애플도 뒤늦게 2017년 6월 애플 뮤직과 연계된 ‘홈팟(HomePod)’을 출시하며 인공지능 개인비서 스피커 시장에 뛰어들었다. 


▲ 애플 ‘홈팟’


국내 기업인 삼성전자도 2916년 11월 애플 시리 개발자들이 모여 설립한 인공지능 솔루션 기업 비브랩스를 인수하면서 뒤늦게 인공지능, 음성로봇 개발을 시작했다. 그 결과물로 삼성전자는 2017년 3월 갤럭시 S8/S8+ 언팩행사에서 딥러닝 기반의 지능형 개인비서 ‘빅스비’를 핵심 서비스로 공개했다. 삼성은 앞으로 이 기술을 스마트폰과 IoT 전자제품에 적용시킨다는 계획이다. 국내는 통신3사와 인터넷 서비스 기업 네이버, 카카오를 중심으로 인공지능 개인비서 스피커를 출시하고 있다. 


이처럼 IT 기업들이 인공지능 개인비서 기술에 적극적으로 투자하고 있는 이유는 무엇일까? 인공지능 개인비서는 스마트홈 스피커를 넘어 자동차, 가전기기, 헬스케어, 금융 등 4차 산업혁명을 대표하는 산업분야에서 업무 혁신과 생산성 향상을 위한 도구로 폭넓게 활용될 가능성이 높기 때문이다. 이미 벤츠는 구글홈을 이용해 벤츠 차량을 제어하는 기능을 제공 중이며 삼성전자도 빅스비를 자사의 차량용 전장시스템에 탑재할 예정이다. 아마존 알렉사는 2017년 3월 미국 최대 의료 포털인 웹단터(Web MD)의 DB와 연계해 의학 정보에 대한 질문에 답변을 제공 중이다. 


또한 인공지능 개인비서는 기술역량 강화를 위한 각 정부의 적극적인 지원도 이어지고 있다. ▲미국은 2016년 10월 ‘국가 인공지능 R&D 전략 계획’ ▲중국은 2016년 5월 ‘인터넷+AI 3년 행동실시방안’ ▲일본은 2016년 4월 ‘인공지능전략회의’ ▲유럽은 2013년 1월 ‘휴먼브레인 프로젝트’ 등을 일찌감치 발표하며 국가 차원의 기술 경쟁력 강화에 총력을 기울이고 있다. 한국은 2017년 3월 미래부가 개인비서 플랫폼의 성능 향상과 사용자 이해, 실시간 자가 학습 등의 주요 요소 개발을 위한 ‘플래그십 프로젝트’ 추진을 발표한 바 있다. 


이에 따라 IT 시장조사기관 가트너(Gartner)는 2019년에는 스마트폰과 사용자 간의 상호 작용 중 20%가 가상개인비서(Virtual Personal Assistants, 이하 VPA)를 통해 이뤄지고, 2020년까지 20억대의 기기와 사물인터넷 장비가 누르지 않고 제어할 수 있는 제로터치(Zero-Touch) UI 기반으로 작동할 것으로 전망했다. 또 현재 전세계 200개 이상의 기업이 인공지능 개인비서 시장에 뛰어들고 있으며 많은 기업들이 기반기술 연구와 응용 개발을 병행하고 있다. 글로벌 IT 대기업과 달리 스타트업들은 에이미(회의일정 잡기), 셰어(건강관리) 등 특정 분야에 특화된 개인비서를 타겟으로 한다. 


아네트 짐머맨 가트너 부사장은 “사람과 기기의 상호 작용 과정에서 터치스크린은 자취를 감추기 시작할 것이고 사람의 음성이나 주변 환경 인식 기술, 바이오메트릭스, 동작, 제스처를 사용하는 비중이 늘어날 것”이라며 IT 디바이스 시장의 변화를 예고했다. 


▲ 업체별 인공지능 홈 스피커 출시


해외 기업, 무료 소프트웨어 공급으로 생태계 구축 목표 

 

■ 아마존 

아마존은 2011년 11월 음성인식 서비스 회사인 얍(Yap), 2012년 10월 자연어 처리기술을 보유한 에비(Evi), 2013년 1월 문자음성자동변환 소프트웨어 기업인 이노바(Inova)를 잇달아 인수하며 기술 확보에 힘썼다. 그 결과 아마존은 2014년 11월 사용자의 음성 명령을 인식해 동작하는 알렉사 기반의 ‘아마존 에코’를 공개하며 지능형 스피커 시장을 개척했다. 이후 주력시장인 미국에서 아마존 에코의 판매량은 약 810만대로 집계(Consumer Intelligence Research Partners, 2017.1.)되며 성공가도를 달리고 있다. 


아마존의 에코의 성공에 힘입어 2016년 3월 기존 에코와 동일한 기능을 탑재한 충전식 휴대용 제품인 ‘아마존 탭(Tap)’과 기존 에코와 동일한 기능을 제공하는 소형 제품인 ‘에코 닷(Echo Dot)’을 출시했다. 2017년에는 내장된 LED 카메라로 사용자의 패션 스타일을 조언해주는 ‘에코 룩(Echo Look)’을, 2017년 5월에는 스크린이 탑재돼 터치 인터페이스와 화상통화를 지원하는 ‘에코 쇼(Echo Show)’를 출시하며 공격적으로 애플리케이션을 확장시켰다. 


이에 더 나아가 아마존은 타기업 또는 개인 개발자도 알렉사의 기능을 고도화하거나 에코와 유사한 알렉사 기반의 자체 음성인식 기기를 쉽게 개발할 수 있도록 개발지원 오픈 소프트웨어 ‘알렉사 스킬 킷(ASK)’를 제공하기 시작했다. 또 써드파티가 직접 제작한 하드웨어에 알렉사를 탑재할 수 있도록 지원하는 소프트웨어 개발도구 ‘알렉사 음성 서비스(AVS)’를 제공함으로써 냉장고, TV 등 전통적인 가전기기뿐 아니라 스마트워치와 같은 웨어러블에 알렉사 인터페인스를 추가하도록 했다. 그 결과 2016년 1월 등록된 알렉사 스킬은 130개에 불과했으나 약 1년이 지난 2017년 2월 기준으로 1만 개가 돌파하며 단기간에 알렉사 생태계가 형성됐다. 


아마존은 무료로 알렉사를 공급함으로써 장기적으로 큰 수익창출을 기대하고 있다. 알렉사 기술은 새로운 서비스 수익원이 될 수 있고, 기술 증가에 따라 아마존의 클라우드 매출 증가도 예상되기 때문이다. 


■ 구글 

구글은 2016년 5월 구글 개발자 컨퍼런스인 ‘Google I/O’에서 기존 ‘구글 나우’의 업그레이드 버전인 ‘구글 어시스턴트’를 발표하며 시장 내 입지를 강화했다. 구글의 디바이스는 텍스트 기반으로 대화를 주고받는 ‘구글 알로(Allo)’와 아마존 에코와 유사한 블루투스 스피커형 개인비서 기기인 ‘구글 홈’의 두 가지 버전으로 구분된다. 구글 홈은 아마존의 에코보다 저렴한 가격과 크롬캐스트를 활용한 TV 연결 등을 차별화 포인트를 부각시켰다. 알렉사가 아마존닷컴과의 연계를 통한 쇼핑에 강점을 가진 반면, 구글은 검색 결과에 대한 답을 구글이 직접 제공하기 위해 CIA의 월드팩트북, 위키피디아 등 다수의 소스로부터 정보를 추출해 구축한 자체 지식 데이터베이스를 보유했기 때문에 지식검색과 양방향 대화에서 우수하다는 평가를 받았다. 


구글 또한 자체 생태계를 만들기 위한 목적으로 2016년 12월 ‘액션 온 구글 플랫폼’을 개발자들에게 개방한 후, 2017년 4월 구글 어시스턴트 개발지원도구(SDK)를 공개했다. 구글 어시스턴트 개발지원도구는 아마존의 알렉사보이스서비스(AVS)처럼 다른 하드웨어 기기에서도 구글 어시스턴트를 연계해 사용할 수 있도록 지원한 것이다. 


더불어 구글은 2017년 3월 2일 마시멜로(안드로이드 6.0)와 누가(안드로이드 7.0)를 사용하는 제조사들의 모든 스마트폰에서 음성형 구글 어시스턴트를 지원한다고 발표했다. 안드로이드는 2016년 4분기 기준 전체 시장의 82%를 차지하는 독점적 지위의 OS이기 때문에 파급력이 상당할 것으로 전망된다. 


국내 기업, ‘한국어’에 최적화된 인공지능 서비스로 차별화 


■ 네이버, 카카오 

네이버는 수년 간 포털 운영을 통해 축적한 인물, 지식백과, 이미지, 동영상, 영화, 날씨 DB 등의 빅데이터를 기반으로 범용적으로 활용될 수 있는 지능형 개인비서를 개발했다. 2013년 네이버 내부 조직으로 설립된 ‘네이버랩스’는 2017년 별도법인으로 분리됐고, 인공지능 기반 제품과 서비스 개발을 전담하고 있다. 2017년 5월 공개된 네이버의 인공지능 플랫폼 ‘클로바’는 네이버랩스와 라인의 개발인력이 주축으로 개발한 첫 번째 결과물이다. 네이버랩스는 지능형 개인비서 뿐 아니라 자율주행차, 로봇까지 연구 분야로 삼고 있으며 매년 400억씩 총 1200억 원을 네이버로부터 출자 받아 안정적으로 연구를 진행하고 있다.


네이버는 클로바를 탑재한 인공지능 스피커 ‘웨이브’와 LG유플러스와 손잡고 ‘네이버 프렌즈’를 선보이고 있다. 네이버 프렌즈는 라인의 인기 캐릭터인 브라운과 샐리 디자인을 적용해 차별화에 성공했으며, 최근에는 미니언즈 캐릭터를 접목시켰다. 네이버의 인공지능 스피커의 특징은 국내 검색 시장에서 압도적인 점유율을 차지하는 네이버의 DB를 토대로, 네이버 지식in, 지식백과 등 2000만 건 이상의 정보를 기반으로 정보 검색에서 강점을 보이고 있다. 


카카오는 2017년 11월 인공지능 스피커 ‘카카오 미니’를 출시했다. 카카오미니의 핵심은 ‘카카오 I(카카오 아이)’다. 카카오 I는 카카오의 인공지능 플랫폼으로 머신러닝, 번역, 추천 기능 등 다양한 인공지능 기술이 집약됐다. 또 카카오 미니는 초창기엔 음성 검색(다음), 음악 듣기(멜론), 뉴스 청취 등을 주요 기능으로 내세워 공개된 인공지능 스피커와 큰 차이가 없는 듯했으나, 향후 카카오톡 문자 읽어주기, 카카오톡 단체방 보이스톡 기능 등을 추가할 예정이다. 


▲ 네이버와 LG유플러스 ‘미니언즈’


■ 통신 3사(SK텔레콤, KT, LG유플러스)

SK텔레콤은 국내에서 최초로 2016년 9월 인공지능 스피커 ‘누구(NUGU)’를 선보였다. 누구는 IPTV Btv와 연동되고, T맵 교통정보 제공, IoT 가전 제어, 일부 배달음식 주문 기능이 특징이다. SK텔레콤은 2017년 8월 ‘누구’와 같은 기능을 제공하면서 크기는 절반 이하로 줄이고, 가격도 낮춘 ‘누구 미니’를 출시했다. 누구 미니는 환율 조회, 금융 정보 제공이 가능한 ‘금융서비스’(국민/하나은행), 영화 정보, 예매 순위 조회가 가능한 ‘영화 정보 서비스’ 등을 새롭게 추가됐다. 


2017년 1월 KT는 인공지능 스피커 ‘기가 지니(GiGA Genie)’를 출시했다. 이 제품은 IPTV 셋탑박스 통합형으로 기존 셋탑박스의 교체 수요를 기반으로 시장 확대 모색하고 있다. 카메라를 내장해 Full HD급 영상 통화와 홈캠이 가능하고 TV와 연동해 사용자와 소통하는 ‘커뮤니케이션 서비스’를 제공하는 것이 타사와 차별점이다. 


KT는 2017년 1월 융합기술원 서비스 연구소 산하에 ‘AI 테크센터’를 만들었고, 이어 5월에는 마케팅 전략본부에 기가지니사업단을 신설하며 적극적으로 인공지능 스피커 사업을 전개하고 있다. 또 KT는 관계사인 KT에스테이트와 건설사와의 협력을 강화해 신규 분양 아파트를 통한 기가지니 확산을 적극적으로 추진하고 있다. KT는 지난 2월 홈 IoT 제어 기능을 강화한 ‘기가 지니 2’를 출시하며 통신사간 인공지능 스피커 시장 경쟁을 예고했다. 


앞서 설명했듯이, 후발주자인 LG유플러스는 네이버와 파트너쉽을 통해 제품을 출시하고 있다. 


■ 삼성전자 

삼성전자 또한 지능형 개인비서 ‘빅스비’를 탑재한 인공지능 스피커 출시를 계획하고 있는 것으로 알려졌다. 현재는 빅스비를 갤럭시 스마트폰의 사용성 제고를 위한 수단으로 우선 활용하고, 자사의 TV, 세탁기 등 가전기기 뿐 아니라 타사 앱과의 연계로 확대를 추진하고 있다. 


삼성은 빅스비 개발에 연구개발, 소프트웨어 개발, 테스트, 기획 등 3000명 이상의 대규모 인력을 투입시켰고, 2016년 인수한 비브랩스의 기술력도 접목시켰다. 2017년 5월 1일 빅스비 보이스가 공식 업데이트된 후 첫날 이용자는 16만 명을 기록했고, 6개월 만에 이용자 100만 명을 넘어섰다. 빅스비는 한국어 버전에 이어 2017년 6월 미국에서 사전 체험단 모집을 시작해 영어버전을 출시했으며 중국어, 스페인어, 독일어 등으로 확대하고 있다. 


삼성전자는 아마존과 구글처럼 타 기업과 개발자들이 빅스비 기반의 자체 애플리케이션을 만들 수 있도록 개발지원도구(SDK)도 공개할 예정이다. 










배너









주요파트너/추천기업