렛서(Letsur)가 원티드랩과 ‘원티드 LaaS를 활용한 교육·프롬프톤 사업 협력을 위한 업무 협약’을 체결했다고 9일 밝혔다. 렛서는 기업 맞춤형 AI 교육 브랜드 ‘에이블 캠퍼스’를 통해 기업 임직원들의 종합적인 AI 이해도를 높이는 실무 교육을 제공하고 있다. 생성형 AI 기초 교육부터, AI를 통해 해결 가능한 과제를 발굴하는 워크숍 등을 통해 기업에 적합한 실질적인 AI 활용 방안을 터득하도록 돕는다. 원티드랩의 LaaS는 생성 AI 활용해 서비스를 개발·운영하고자 하는 기업을 위한 생성AI 플랫폼이다. 오픈AI, 구글, 앤쓰로픽, 메타 등 20여 종의 LLM, 멀티모달 및 편리한 RAG 등을 지원하며 사내에서 100명 이상의 임직원이 동시에 실습할 수 있는 환경을 제공한다. 양사는 국내 기업의 안정적이고 빠른 AI 도입을 위해 MOU를 체결했다. 에이블 캠퍼스의 실무 중심 교육 노하우와 원티드 LaaS의 안정적인 실습 환경을 통해 실효성 있는 AI 교육 프로그램을 구축하고, 임직원들의 AI 이해도와 역량 강화를 필요로 하는 기업들에 서비스를 제공할 예정이다. 또한 임직원들이 각 부서와 직무에 따라 AI로 해결이 필요한 과제를 발굴한 뒤 실제 비즈
향상된 멀티모달 기능 제공해 다양한 형태의 정보 이해 및 처리 구글이 새로운 에이전트 시대를 위한 ‘에이전트형(agentic) AI 모델’인 ‘제미나이 2.0’을 출시했다. 제미나이 2.0은 지금까지 구글이 선보인 모델 중 가장 뛰어난 성능을 자랑하는 모델이다. 네이티브 이미지 및 오디오 출력, 네이티브 툴 사용 등 향상된 멀티모달 기능을 제공해 텍스트, 이미지, 동영상, 오디오, 코드 등 다양한 형태의 정보를 자연스럽게 이해하고 처리한다. 구글은 제미나이 2.0을 통해 비전으로 제시하는 ‘유니버설 어시스턴트’에 한 발짝 다가섰다고 밝혔다. 제미나이 2.0을 기반으로 새롭게 개선된 프로젝트 아스트라는 다국어 대화, 구글 툴(구글 검색, 구글 렌즈, 맵스 등) 사용, 최대 10분 동안의 대화를 기억하는 향상된 메모리, 빠른 응답 속도 등의 기능을 제공한다. 구글은 이러한 기능을 구글의 AI 어시스턴트인 제미나이 앱 등 구글 제품은 물론, 다른 폼 팩터에도 도입하기 위해 노력하고 있다. 복잡한 작업을 도와주는 에이전트인 ‘프로젝트 마리너’는 웹 브라우저에서 작동하는 에이전트 프로토타입으로, 픽셀 및 텍스트, 코드, 이미지, 양식과 같은 웹 요소를 포함해 브라우저
김윤 CSO 영입으로 글로벌 AI 기업으로의 도약 가속화할 계획 밝혀 트웰브랩스가 김윤 박사를 CSO(최고전략책임자 겸 사장)로 영입했다고 26일 밝혔다. 김윤 CSO는 스탠퍼드대학교 공학박사 출신으로, 애플의 인공지능 비서 '시리(Siri)' 개발에서 핵심적인 역할을 수행한 AI 분야 권위자다. 스탠퍼드 연구소 연구원을 거쳐 음성인식 기술 스타트업 노바리스(Novauris)의 CEO를 역임했으며, 2013년 애플의 노바리스 인수 후에는 시리의 음성인식 AI 기술 개발을 주도했다. 이후 SK텔레콤 AI센터장과 CTO를 역임하며 대기업의 AI 혁신을 주도했고, 새한창업투자 파트너로서 유망 스타트업 발굴 및 육성에 힘쓰는 등 국내 AI 생태계 전반에서 혁신을 이끌어 왔다. 트웰브랩스는 김윤 CSO 영입으로 글로벌 AI 기업으로의 도약을 가속화할 계획이다. 높은 수준의 멀티모달 AI 기술 기반으로 글로벌 엔터프라이즈 시장 공략을 강화하고 미국 실리콘밸리와 한국의 AI 생태계를 잇는 핵심 역할을 맡아 글로벌 사업 전략을 총괄하고 세계적 수준의 AI 인재 확보에도 주력할 예정이다. 김윤 CSO는 "트웰브랩스는 세계 최고 수준의 멀티모달 AI 기술력에 더해 이를 비즈니
디플리 이수지 대표 인터뷰 AI 기술이 시각 인식을 넘어 청각 분야로 확장되는 추세다. 음성을 통한 상호작용이 일상화함에 따라, AI는 현대인의 일상 및 작업 환경을 효과적으로 변화시키고 있다. 디플리는 소리 기반 AI 기술을 통해 기존 산업의 효율성을 극대화하고 새로운 가치 창출을 목표로 삼았다. 이에 디플리 이수지 대표를 만나 회사의 창업 배경과 기술 발전 과정, 그리고 장기적인 로드맵에 대해 이야기 나눠봤다. 위험을 미연에 방지하는 ‘리슨 AI’ 디플리는 위험 감지와 제조 분야에서 소리 데이터를 활용한 AI 솔루션을 개발해 주목받았다. 디플리가 개발한 ‘리슨 AI’는 비명, 충돌음, 기계 소음 등의 패턴을 실시간으로 분석해 산업 현장과 공공 장소에서의 안전 문제를 해결하는 데 유의미한 성과를 거두고 있다. 또한, B2B 중심으로 AI를 활용한 예지 보전 시스템을 도입해 제조업계의 효율성과 안전성을 모두 잡고자 한다. 특히 리슨 AI는 단순히 소리의 크기나 진동을 감지하는 것을 넘어, 복잡한 환경에서 여러 소리의 특징을 분석하고 패턴을 인식해 실제 현장의 상황을 실시간으로 판단할 수 있다는 점에서 차별화한다. 이러한 기술력은 지하철, 대형 쇼핑몰, 제조업
최근 빅테크는 단순한 텍스트 기반 AI에서 한 걸음 나아가 사용자의 다양한 요구를 만족시키기 위해 음성과 영상을 포함하는 멀티모달 AI 개발에 박차를 가하고 있다. 이러한 기술 진화는 텍스트에서 멀티미디어로 정보를 처리하는 방식의 전환을 의미하며, 사용자 인터페이스와 디지털 커뮤니케이션의 패러다임을 재정립하고 있다. 멀티모달 AI의 발전은 기계가 인간의 다양한 커뮤니케이션 방식을 이해하는 능력을 한층 향상시키고 있다. 멀티모달 기술로 혁신하는 커뮤니케이션 멀티모달 AI는 텍스트를 포함해 음성, 이미지, 비디오 등 다양한 유형의 정보 입력을 통합해 처리하고, 이를 바탕으로 정교한 출력을 제공하는 AI 기술이다. 이 기술은 각기 다른 데이터 소스에서 정보를 수집하고 해석함으로써 사용자에게 자연스러운 상호작용을 가능하게 하며, 다양한 상황에 맞는 응답을 생성한다. 현대인은 디지털 컨텐츠 소비의 변화와 사용자 경험의 향상을 추구한다. 이 과정에서 자연스러운 커뮤니케이션을 원한다는 특징이 있다. 한 예로, 음성인식 기능은 이제 일상생활에서 어렵지 않게 찾아볼 수 있다. 이러한 수요에 부응해 빅테크 기업들은 AI의 음성 인식 및 처리 능력을 강화하는 추세다. 또한, 비
LG전자는 ‘LG 이동형 AI홈 허브’가 6∼10일(현지시간) 독일 베를린에서 열린 유럽 최대 가전 전시회 ‘IFA 2024’에서 해외 유력 매체들로부터 최고 제품에 선정됐다고 11일 밝혔다. LG 이동형 AI홈 허브는 LG전자의 인공지능(AI) 에이전트 ‘퓨론’(FURON)을 탑재, 두 다리에 달린 바퀴와 자율 주행 기술로 움직인다. 음성·음향·이미지 인식을 접목한 멀티모달(복합정보처리) 센싱 능력도 갖췄다. 영국 정보기술(IT) 전문매체 테크레이더는 LG 이동형 AI홈 허브에 대해 “개성이 넘치고 살 만한 가치가 있다고 생각하게 만든 최초의 로봇”이라고 평가하며 IFA 2024 스마트홈테크 부문 최고 제품으로 선정했다. 영국 테크 매체 테크어드바이저와 T3도 LG 이동형 AI 홈 허브를 최고 제품으로 꼽았다. LG전자의 생활 가전에 대한 호평도 이어졌다. 미국 IT 전문매체 테크리셔스는 이번 IFA에서 처음 선보인 ‘에어로 캣’에 대해 높은 점수를 주고, 에디터스 초이스로 선정했다. 에어로 캣은 고양이를 키우는 고객을 위한 공기청정기다. 이 제품은 히터로 고양이가 앉는 자리를 따뜻하게 데워주며 고양이가 올라갔을 때는 쉴 수 있도록 공기청정기 풍량을 줄이는
테스트웍스는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2024년 초거대 AI 확산 생태계 조성 사업’ 중 멀티모달(이미지·비디오·오디오 등 데이터 동시 처리 기술) ‘트립체인 데이터’ 구축 사업의 주관 기업으로 선정됐다고 28일 밝혔다. 초거대 AI 확산 생태계 조성사업은 기존 ‘인공지능(AI) 학습용 데이터 구축사업’을 전환해 최근 국내외 AI 서비스 경쟁력의 관건이 되는 초거대 AI 데이터 구축·개방을 통해 AI 생태계를 조성하고 안전한 AI 일상화를 실현할 수 있도록 지원하는 것이 목적이다. 테스트웍스는 지난 5년간 ‘인공지능(AI) 학습용 데이터 구축사업’을 통해 약 20여 개에 달하는 과제를 수행해 왔다. 인도보행, 교통물류, 재난안전환경, 농축수산, 한국어-수어 등의 분야에서 대규모 데이터를 성공적으로 구축해 데이터 수집부터 가공 검증까지 관련 핵심 기술들을 턴키로 보유하고 있다. 테스트웍스가 주관기업으로 참여하는 트립체인 데이터 구축 사업에서 ‘트립체인’은 교통 이용자가 출발지에서 목적지에 도착하는데 까지 이동하는 전 과정에서 환승 및 환경을 포함한 전체 트립(이동)의 과정을 의미한다. 이번 사업에서는 특히 수요자
국내 최대 규모의 비영리 머신러닝 커뮤니티 가짜연구소(대표 김찬란)가 15일 마이크로소프트 광화문 본사에서 ‘제8회 슈도콘(8th PseudoCon)’을 개최한다. 이번 컨퍼런스는 약 200명의 AI 엔지니어가 참석한 가운데 ‘AI 파도 속에서 나만의 북극성 찾기’를 주제로 진행될 예정이다. 이번 행사에서는 급변하는 AI 산업 환경 속에서도 한국의 인공지능 연구개발자들이 자신만의 방향성을 찾을 수 있도록 돕기 위해 기획됐다. 김찬란 대표가 이끄는 가짜연구소는 대기업, 스타트업, 외국계 기업 등 다양한 배경을 가진 AI 연구개발자들이 공동 프로젝트를 통해 혁신적인 연구를 수행하는 곳으로, 이번 컨퍼런스를 통해 그동안의 성과를 발표할 예정이다. 컨퍼런스는 김찬란 대표의 키노트를 시작으로 구글클라우드, AWS, 시프트업, 스캐터랩, 카카오 등 주요 테크 기업 현직자들의 초청 강연으로 이어진다. 이후 가짜연구소의 대표 연구원들이 비영리 연구 활동을 공유하는 기여 발표를 진행하며, 데모 세션에서는 연구 결과를 실제로 체험할 수 있는 기회가 제공된다. 특히, 허깅페이스와 협업 중인 HuggingFace KREW팀의 김하림이 핸즈온 세션에서 직접 코딩을 통한 실습 시간을
머스크 "AGI를 가장 똑똑한 인간보다 더 똑똑한 AI로 정의한다면 2년 이내에 가능할 것" 세계적으로 인공지능(AI) 개발 열풍이 불고 있는 가운데 일론 머스크 테슬라 최고경영자(CEO)가 인간을 능가하는 AGI(범용인공지능)가 내년에 나올 수도 있다고 밝혀 관심을 끌고 있다. 머스크는 8일(현지시간) "AGI를 가장 똑똑한 인간보다 더 똑똑한 AI로 정의한다면 아마도 내년에, 예를 들어 2년 이내에 가능할 것"이라고 말했다. 자신의 사회관계망서비스(SNS) 엑스(X·옛 트위터)에서 진행한 노르웨이 국부펀드 CEO 니콜라이 탕겐과의 인터뷰에서다. 머스크는 '아마도(probably)', '생각한다(think)' 등의 표현을 사용하고 구체적인 증거 등에 대한 제시는 없었다. 그러나 머스크 역시 AI 스타트업 xAI를 통해 AI 모델을 개발하고 있다는 점에서 그의 발언은 주목된다. 특히 그의 전망은 "5년 이내에 인간과 같은 수준의 AGI가 등장할 것"이라는 AI 칩 선두 주자 엔비디아의 젠슨 황 CEO의 전망을 크게 앞서는 것이다. 젠슨 황 CEO는 작년 11월 뉴욕 링컨 센터에서 열린 뉴욕타임스(NYT) 주최 딜북 콘퍼런스에서 이같이 언급한 바 있다. 오픈A
엔비디아, 비용 절감 및 도메인별 용도에 따라 작업 속도 크게 높여 엔비디아가 구글과 협력해 모든 엔비디아 AI 플랫폼에서 AI 모델 ’젬마’를 위한 최적화를 실시했다고 밝혔다. 이를 통해 엔비디아는 비용을 절감하고 도메인별 용도에 따라 작업 속도를 혁신적으로 높였다. 어디서나 실행 가능한 젬마는 구글의 새로운 경량 오픈 언어 모델로, 20억 파라미터와 70억 파라미터 크기로 제공된다. 젬마는 구글의 멀티모달 모델인 제미나이 개발에 사용된 동일한 연구와 기술을 기반으로 구축됐다. 엔비디아는 구글과 긴밀히 협력해 엔비디아 텐서RT-LLM으로 젬마의 성능을 가속화했다. 텐서RT-LLM은 데이터센터, 클라우드 혹은 엔비디아 RTX GPU가 탑재된 PC에서 대규모 언어 모델(LLM) 추론을 최적화하는 오픈 소스 라이브러리다. 이를 통해 개발자는 전 세계 고성능 AI PC에 탑재된 1억 개 이상의 엔비디아 RTX GPU를 활용할 수 있다. 개발자는 클라우드 상의 엔비디아 GPU에서도 젬마를 실행할 수 있다. 여기에는 H100 텐서 코어 GPU를 기반으로 하는 구글 클라우드 A3인스턴스가 포함되며, 초당 4.8테라바이트의 141GB HBM3e 메모리를 갖춘 엔비디아 H
1.0 프로보다 동시에 정보를 처리할 수 있는 능력 크게 향상돼 구글은 15일(현지시간) 자체 개발한 멀티모달 인공지능(AI) 모델 '제미나이 1.0 프로'의 업데이트 버전을 공개했다. 제미나이는 학습 규모에 따라 울트라·프로·나노로 나뉘는데, 이날 공개한 '제미나이 1.5 프로'는 구글의 최신 AI 모델인 제미나이 1.0 울트라와 비슷한 수준으로 텍스트·이미지·음성·영상을 생성하는 중형 멀티모달 모델이다. 구글은 제미나이 1.5 프로가 기존 1.0 프로보다 동시에 정보를 처리할 수 있는 능력이 크게 향상돼 긴 문맥을 이해하는 역량이 뛰어나다고 설명했다. AI 모델이 한 번에 처리할 수 있는 정보의 양을 '콘텍스트 윈도(context window)'라고 하는데, 이는 단어·이미지·영상·오디오·코드 등의 의미를 가진 '토큰(token)'이라는 단위로 구성된다. 제미나이 1.5 프로는 최대 100만 개의 토큰 처리 능력을 갖췄다. 이는 기존 1.0 프로가 수행하는 3만2000개의 토큰 처리 규모를 크게 뛰어넘는 것이다. 다시 말해 1시간 분량의 동영상과 11시간 분량의 음성 파일, 3만 줄 이상의 코드, 70만 단어 이상의 텍스트에 해당하는 방대한 정보를 한 번
에이닷 LLM과 엔트로픽 LLM, 코난 LLM 등을 조합해 고객 맞춤형 서비스 개발 추진 SK텔레콤(이하 SKT)이 23일 기업·공공용 ‘생성형 AI 시장’ 공략을 위한 ‘멀티 LLM(Large Language Model)’ 전략을 발표했다. SKT는 기업 및 공공기관 등의 요구에 맞춰 대화 및 고객센터 등 통신사 기반 서비스를 중심으로 자체 개발해온 에이닷 LLM과 윤리적 답변 및 대용량 텍스트 입력에 강점이 있는 엔트로픽의 LLM, 한국어 데이터가 풍부한 코난 LLM 등을 조합해 고객 맞춤형으로 제공하기 위한 기술 및 사업적 준비를 진행 중이라고 밝혔다. 현재 국내 LLM 시장은 오픈AI를 필두로 다수 기업들이 자사 LLM 기반의 사업을 준비 중인데, SKT는 자체 LLM과 더불어 업계에서 인정받는 타사의 LLM까지 포함한 라인업으로 ‘멀티 LLM’ 사업 추진 계획을 밝힌 것이다. 우선 자강의 측면에서 한국어 기반의 SKT 에이닷 LLM은 8월부터 엔터프라이즈용 기본모델을 출시하고 고객사 대상 모델을 학습시키고 최적화 작업을 진행하고 있다고 밝혔다. LLM 기본모델은 문서 요약, 문서 생성, Q&A 등을 수행할 수 있는 기본 기능을 갖춘 AI 소프
CJ대한통운이 동영해운과 함께 아시아 3개국과 몽골을 잇는 복합물류 서비스를 제공하는 등 중국, 중앙아시아, 동유럽을 망라한 북방지역 물류영토 확장에 나선다. CJ대한통운은 동영해운과 ‘북방물류 공동개발 업무협약 체결식’을 가졌다고 4일 밝혔다. 이번 협약을 통해 양사는 동영해운이 운영 중인 한국-몽골 간 멀티모달 서비스를 활용해 아시아 3개국 고객사에게 몽골 수출화물 운송서비스를 제공할 계획이다. 멀티모달이란 해상, 육상 등 복수의 운송수단을 이용해 화물을 운송하는 것으로 복합운송이라고도 불린다. 양사는 CJ대한통운의 한국, 일본, 베트남 등 아시아 3개국 컨테이너 화물을 선박을 이용해 중국 신강항까지 해상운송한다. 이후 중국횡단철도과 몽골횡단철도를 이용해 몽골의 수도 울란바토르까지 육상운송하게 된다. 여러 나라의 화물을 모아 규모화해 운송하는 만큼 더욱 경쟁력 있는 운임 제공이 가능할 전망이다. 향후 양사는 중국, 중앙아시아, 동유럽 등 유라시아 대륙 북방지역을 대상으로 추가 운송경로와 서비스 개발을 추진하기로 했다. 화물 발송지에서 도착지까지의 운송과정 일체를 전담해주는 앤드 투 앤드 서비스와 그 외 부가적인 서비스도 개발하는 등 상생협력 관계를 지속할
장기 기억 기술, 멀티 모달 기술 등으로 서비스 고도화 추진 SK텔레콤은 AI 서비스 '에이닷'을 챗GPT 형태로 고도화해 연내 정식으로 선보일 예정이라고 8일 밝혔다. 손인혁 SKT A.추진단 PMO(프로젝트 관리 책임자) 담당은 이날 오후 열린 2022년 실적 발표 콘퍼런스콜에서 "금년 내 현행 오픈 베타 서비스를 정식으로 출시함과 동시에 수익화 비즈니스 모델도 같이 검토할 것"이라며 이같이 말했다. 그는 B2C 분야 첫 한국어 GPT3 상용화 서비스였던 에이닷이 지난해 5월 출시 이후 아홉 번의 큰 업데이트를 진행했다면서 고객 피드백과 외부 제휴 등을 통해 서비스 영역을 확대하고 있다고 전했다. 김영준 SKT A.추진단 담당도 "SKT는 많은 고객 데이터를 보유하며, 이를 기반으로 챗GPT 형태로 고도화하는 작업을 내부적으로 하고 있다"고 알렸다. 그는 구체적으로 이달 중으로 오래된 정보를 기억해 대화에 활용하는 '장기 기억' 기술, 텍스트뿐 아니라 사진과 음성 등 복합적인 정보를 이해하는 '멀티 모달' 기술을 장착해 서비스 고도화에 나설 예정이라고 전했다. 그는 에이닷이 "현재보다 훨씬 자연스러운 대화 인터페이스를 구현할 것"이라고 기대했다. 그는 "
사진 등 복합정보 이해하는 '멀티모달' 서비스도 도입 SK텔레콤은 성장형 AI(인공지능) 서비스 '에이닷'에 오래된 정보를 기억해 대화에 활용할 수 있는 '장기기억' 기술을 다음 달 장착해 서비스 고도화에 나선다고 24일 밝혔다. 장기기억 기술을 장착하면 이용자가 에이닷과 오래전에 대화했던 내용 중 중요한 정보를 별도 메모리에 저장해두고, 사람이 마치 뇌 속에서 오래된 기억을 끄집어내듯 대화 중에 활용할 수 있다. 아울러 사진과 텍스트 등 복합적인 정보를 함께 이해할 수 있는 멀티모달 서비스도 에이닷에 장착한다. 기존 초거대 AI가 주로 언어에 초점을 맞춘 모델이라면 멀티모달 AI는 텍스트 이외에 음성, 이미지, 제스처, 생체 신호 등 여러 방식의 데이터를 인간처럼 종합 추론하고 의사소통까지 할 수 있는 AI 기술이다. SKT는 연초부터 AI 기술 주도권을 놓지 않겠다는 의지를 담아 이 같은 행보에 나섰다고 한다. SKT는 국내 최초로 초거대 언어 모델인 GPT-3의 한국어 버전을 상용화한 에이닷 서비스를 론칭한 데 이어, 이를 기반으로 서비스를 고도화 중이다. 현재까지 별도 설치가 필요 없는 'A.game', 이용자의 시청 이력과 선호도 기반으로 추천 채널