배너
닫기

기획특집

배너

AI 어시스턴트 집중하는 빅테크, 시장 주도할 기술 포인트는?

URL복사

AI 어시스턴트는 일상과 업무에서 혁신적인 변화를 가져오고 있다. 이 서비스는 생산성을 높이고 개인화한 경험을 제공함으로써 우리의 생활 방식을 근본적으로 변화시킬 것으로 보인다. AI 어시스턴트의 역할과 중요성이 확대되는 가운데, 마이크로소프트와 구글 등 주요 빅테크가 발표한 AI 어시스턴트 기술이 주목받고 있다. 이들은 사용자와 AI의 간극을 더욱 좁힐 뿐 아니라 기술 활용성을 극대화함으로써 새로운 AI 시대의 조력자를 완성하고 있다. 



생성형 AI 탑재한 코파일럿+PC 선보인 MS

 

마이크로소프트(MS)는 지난 5월 20일(현지시간) AI 기능이 탑재된 새로운 PC를 발표했다. 사티아 나델라 최고경영자(CEO)는 연례 개발자 회의 ‘빌드(Build)’를 하루 앞두고 워싱턴주 레드몬드 캠퍼스에서 열린 미디어 콘퍼런스에서 ‘코파일럿+ PC’라고 이름한 새로운 PC를 공개했다.

 

MS의 모든 제품에 탑재된 생성형 AI 모델로 코파일럿+ PC는 생성형 AI 구동에 최적화한 고성능 PC다. MS는 코파일럿+PC가 초당 40조 회의 연산하며, 애플의 노트북 라인업인 맥북에어보다 AI 작업 처리 속도가 58% 뛰어나다며 애플을 겨냥했다. 또한, 오픈AI의 최신 AI 모델 GPT-4o이 탑재되고, 배터리 수명은 하루 동안 지속될 것이라고 설명했다. 

 

새로운 PC에는 퀄컴과 함께 AMD, 인텔 등의 칩이 탑재될 예정이다. MS는 이 PC가 오디오 번역과 수신 메시지에 대한 응답 추천, 설정 앱에서 변경 사항 제안 등의 기능을 할 수 있다고 설명했다. 이와 함께 코파일럿+PC의 첫 모델로 이날 서피스 랩톱과 서피스 프로 태블릿을 공개했다. 이들 모델에는 윈도 운영체제에 AI 기능을 최적화하도록 Arm 아키텍처를 기반으로 한 퀄컴의 새로운 스냅드래곤 X 프로세서가 탑재됐다. 

 

구글, 비서 기능 갖춘 생성형 AI 제미나이 발표

 

구글이 자사의 생성형 AI 제미나이를 탑재한 검색 엔진을 정식으로 출시했다. 사람처럼 대화하는 비서와 같은 AI 기능도 선보였다. 지난 5월 구글은 미 캘리포니아주 마운틴뷰 쇼어라인 엠피씨어터에서 ‘구글 연례 개발자 회의(I/O)’를 열고 자사의 최신 AI 모델인 제미나이를 통해 AI의 미래를 현실화하기 위한 비전을 발표했다.

 

AI 개요는 제미나이를 이용해 검색 결과를 빠르게 요약하고 관련 링크를 제공받는 기능이다. 대화 형태로 검색할 수 있고, 사진뿐 아니라 동영상으로도 검색이 가능해진다. 제미나이가 탑재된 새 검색 기능은 미국을 시작으로 수 개월 안에 다른 국가에도 제공된다. 구글은 연말까지 10억 명 이상에게 제공할 계획이다. 

 

구글은 또 제미나이와 구글의 음성 모델을 기반으로 하는 새로운 ‘프로젝트 아스트라(Project Astra)’도 선보였다. 이는 미래 AI 어시스턴트 구현을 위한 구글의 비전으로, AI가 사람처럼 보고 들을 수 있고 음성으로 대화하면서 이용자의 개인 비서 역할을 하는 기능이다. 시연 영상에는 휴대전화 카메라로 주변 상황을 보여주고 안경이 어디에 있는지를 묻자 이를 알려주고, 현재 위치를 묻자 정확하게 파악하고 음성으로 이를 알려주는 AI 비서의 모습이 담겼다.

 

구글은 프로젝트 아스트라 구현을 위한 스마트안경을 착용하고 AI와 대화하는 영상을 공개하기도 했다. 구글은 프로젝트 아스트라 비전을 위한 전 단계로 ‘제미나이 라이브’를 선보였다. 이 기능은 사람처럼 대화하고 이미지는 업로드를 통해 인식한다. 구글은 제미나이 라이브를 수개월 내에 출시하고 이후 실시간 시각과 청각 등 프로젝트 아스트라를 위한 기능도 추가할 계획이라고 밝혔다. 

 

오픈AI, ‘GPT-4o’로 새로운 충격 안겨주다

 

오픈AI가 지난 5월 보고 듣고 말하는 새로운 AI 모델을 공개했다. 오픈AI의 미라 무라티 최고기술책임자(CTO)는 라이브 행사를 통해 ‘GPT-4o’라는 이름의 이 새 AI 모델을 공개하고, 시연을 선보였다. GPT-4o는 주로 텍스트를 통해 대화할 수 있었던 기존 모델과 달리 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있는 AI 모델이다.

 

새 모델의 ‘o’는 모든 것이라는 ‘옴니(omni)’를 뜻한다. 이 모델은 텍스트는 물론, 청각과 시각으로도 추론하고 이를 말하는 똑똑해진 음성 어시스턴트다. 특히 이용자 질문에 곧바로 답이 제공된다. 오픈AI는 GPT-4o의 응답 시간이 최소 232밀리초, 평균 320밀리초로, 이는 인간의 응답시간과 비슷하다고 설명했다. 

 

이전 모델인 GPT-3.5는 평균 2.8초, GPT-4가 응답에 5.4초가 걸렸다. GPT-4o는 사람처럼 대화가 가능하고, 답 제공 중에 끼어들어도 대화는 계속 이어진다. 실시간 번역 기능도 담았다. GPT-4o가 기존 GPT-4 터보보다 두 배 더 빠르고 비용은 2분의 1 수준이라고 설명했다. GPT-4 터보는 지난해 11월 선보인 최신 버전이다.

 

오픈AI는 이번 모델로 한국어 등 50개 언어에 대한 챗GPT의 품질과 속도가 향상됐으며, 발표일로부터 개발자가 새 모델을 사용해 애플리케이션을 구축하도록 자사 API를 통해서도 이용할 수 있다고 덧붙였다. 무료로 제공되지만 기존 유료 구독자는 무료 이용자보다 5배 많은 질문을 할 수 있고, AI 음성 모드는 몇 주 안에 공개될 예정이다. 

 

애플의 시리, 생성형 AI 탑재로 돌아온다

 

애플은 6월 연례 세계 개발자 회의(WWDC)에서 AI 전략을 발표할 예정이다. AI 경쟁에서 뒤처졌다는 평가를 받아온 애플은 자사의 음성 비서인 ‘시리(Siri)’에 생성형 AI를 탑재할 것으로 전해졌다. 뉴욕타임스(NYT)는 애플이 6월 열리는 세계개발자콘퍼런스(WWDC)에서 대대적으로 개편한 시리를 공개할 준비를 하고 있다고 소식통을 인용해 보도했다. 소식통은 차세대 시리는 이용자와 더 대화가 잘 되고 더 많은 종류의 요청을 이해하는 등 생성형 AI에 의해 작동될 것이라고 전했다. 

 

애플의 소프트웨어 엔지니어링 담당 수석 부사장인 크레이그 페더리기와 AI 수석 존 지아난드리가 지난해 초 수주 간에 걸쳐 챗GPT를 테스트해 보고 시리에 생성형 AI 탑재를 결정한 것으로 알려졌다. 이를 계기로 애플은 AI 도구 개발 경쟁에서 뒤처지지 않기 위해 대대적인 조직 개편을 단행했으며, 직원과 엔지니어 등을 대거 AI에 재배치했다. 이런 전략의 변화는 전기자동차 ‘애플카’ 프로젝트 취소에도 영향을 미친 것으로 전해졌다. 애플은 시리의 이 기능을 클라우드가 아닌 기기 자체에서 구동하도록 할 계획이다. 

 

헬로티 서재창 기자 |









배너










주요파트너/추천기업