포티투마루 RAG42 솔루션과 네이버 하이퍼클로바X 연계로 원스톱 서비스 제공 포티투마루가 네이버클라우드로부터 전략적 투자를 유치했다고 8일 밝혔다. 지난해 12월 ‘하이퍼클로바X’ 기반의 초거대 인공지능 사업 협력을 위해 업무 협약을 체결한데 이어 시리즈B 라운드에서 투자를 유치하며 HyperCLOVA X 기반의 파트너십 구축을 공고히 했다. 이번 투자는 네이버의 초대규모 AI ‘하이퍼클로바X를 기반으로 두 회사 간의 기술 협력을 강화하고 사업적 시너지를 극대화하기 위한 전략적 투자다. 양사는 포티투마루의 RAG42와 하이퍼클로바X와의 연계로 각 산업군별 도메인 특화 엔진 개발이 가능하도록 RAG 컨설팅부터 LLM 솔루션 구축까지 원스톱 서비스를 제공할 예정이다. 네이버클라우드는 포티투마루가 그동안 글로벌 생성형 AI 분야에서 보여준 뛰어난 기술력과 혁신성이 높게 평가됐고, 다년간 시장에서 검증받은 다양한 상용 사례가 투자 유치에 주요하게 작용했다고 전했다. 네이버클라우드 임태건 전무는 “포티투마루와의 사업적 제휴 협력에 이은 전략적 투자를 통해 하이퍼클로바X를 활용해 생성 AI 분야에서 실질적인 성과를 창출해 가고자 하는 양사의 공동 목표를 실현하고자 한
AMD MI300X 기반 SR685a V3 8GPU 서버 론칭..."기업 AI 전환 가속화 도와" 씽크애자일 MX 455 V3 엣지 솔루션, 씽크시스템 SD535 V3 서버도 함께 공개 레노버와 AMD가 생성형 AI 및 거대언어모델(LLM) 워크로드에 특화된 새로운 서버 및 엣지 솔루션을 이달 8일 발표했다. 양사는 금융·의료·에너지·기후연구·운송 등 대량의 데이터 세트를 관리해야 하는 분야에 IT 인프라 솔루션을 제공하기 위해 이번 신제품 설계에 협력했다. 그 첫 번째 제품은 씽크시스템(ThinkSystem) SR685a V3 GPU 서버로, 대규모 데이터 세트를 처리하기 위한 대용량 메모리와 I/O 대역폭을 제공한다. 이 제품은 엔터프라이즈 프라이빗 온프레미스 AI 및 퍼블릭 AI 클라우드 서비스 제공자 등에 최적화된 솔루션으로 알려졌다. 씽크시스템 SR685a V3에는 AMD 4세대 EPYC CPU와 AMD 인스팅트 MI300X GPU가 이식됐다. 여기에 AMD 인피니티 패브릭을 통해 상호 연결되며, 1.5TB 고대역폭(HBM3) 메모리, 최대 총 1TB/s의 GPU I/O 대역폭 성능 그리고 공기 냉각 기술을 담았다. 현재 엔비디아 HGXTM GPU
생성형 AI 원천기술의 활용 확대 지원, 생성형 AI 응용기술 전파 위한 협력 나서 업스테이지는 원티드랩과 ‘원티드 LaaS(LLM-as-a-Service, 서비스형 거대언어모델) 서비스 협력을 위한 업무협약’을 체결했다고 2일 밝혔다. 협약식에는 업스테이지 권순일 사업총괄 부사장과 원티드랩 주형민 AX사업개발 총괄 등이 참석했다. 이를 통해 양사는 생성형 AI 원천기술의 활용 확대 지원, 생성형 AI 응용기술 전파를 위한 공동 협력, 성공 사례에 대한 대외 홍보 협력 등 다양한 분야에서 손을 맞잡기로 했다. 원티드 LaaS는 원티드랩이 다수 생성형 AI 서비스를 개발·운영하며 쌓은 노하우를 집약한 솔루션이다. 생성형 AI 서비스를 쉽게 개발하는 환경, 다양한 LLM 모델, 자동화된 테스트 환경, 프로젝트 및 프리셋 단위 상세한 토큰 사용량 관리, 할루시네이션 제어를 위한 RAG 기능 등을 구독 형태로 제공한다. 솔라는 빅테크 모델보다 작은 사이즈로 더 빠른 속도와 성능을 탑재, 속도와 비용 효율성이 관건인 기업용 LLM 시장에 최적화한 모델로 꼽힌다. 최근 아마존웹서비스(AWS)에서 AI 모델을 제공하는 '아마존 세이지메이커 점프스타트' 등 글로벌 플랫폼에
도메인 특화 초거대 언어모델인 'LLM42'와 'RAG42' 솔루션 소개해 포티투마루가 AI EXPO 2024에서 산업 특화 생성형 AI 솔루션을 선보인다고 1일 밝혔다. AI EXPO 2024(국제인공지능대전)은 올해 7회차를 맞이하는 인공지능 전문 전시 행사로 아시아 최대 규모로 5월 1일부터 3일까지 서울 강남구 삼성동 코엑스에서 개최된다. (사)한국인공지능협회, 인공지능신문이 주최하며 약 300개사 500여부스 규모로 AI 융합 비즈니스 개발 컨퍼런스인 ‘AI Tech 2024’, 생성형 AI에 집중한 ‘인공지능 융합산업 포럼’ 등 다양한 부대행사가 동시 개최된다. 포티투마루는 전시장 안쪽에 스페셜 패키지 부스로 전시공간을 준비해 도메인 특화 초거대 언어모델인 'LLM42'와 LLM 상용화의 핵심 요소인 'RAG42' 솔루션을 소개한다. 특히 초거대 언어모델 기반의 생성형 AI 서비스 상용화 사례를 소개하고, 기업에서 AI를 도입하고 활용 시 고려해야 하는 요소 등 생성형 초거대 AI 플랫폼 관련 컨설팅을 진행할 예정이다. 포티투마루는 생성형 AI 스타트업으로 초거대 언어모델의 단점인 환각 현상을 검색증강생성 기술인 RAG42와 인공지능 독해 기술인
인공지능 전문기업 인공지능팩토리는 25일 대원제약과의 챗봇 서비스 ‘WERT’ 공급 계약을 완료했다고 발표했다. 이번 계약은 회사의 제약 산업 분야 첫 진출로, 대원제약은 이 챗봇을 활용하여 회사 내부의 자주 묻는 질문에 대한 신속한 대응을 통해 업무 효율을 높이기 위해 구독형 서비스를 도입하기로 결정했다. 인공지능팩토리에 따르면, 코로나 사태 이후 기업 문화의 혁신과 비용 절감의 필요성이 부각되면서, 챗봇을 통한 인건비 절감과 경영 효율성 증가, 그리고 시공간 제약 없는 접근성 향상이 기업들의 주요 요구로 떠올랐다. 특히, WERT는 회사 내부 문서와 자료를 기준으로 정확한 정보 검색 및 응답 기능을 제공함으로써 중요한 역할을 할 것으로 기대된다. 인공지능팩토리의 김태영 대표는 “대형 언어 모델(LLM)의 활용은 단순한 지식 획득을 넘어서 기업의 업무 효율성을 극대화하고 원가를 절감하는 데 큰 잠재력을 지니고 있다”며, “WERT에 대한 기대가 크다”고 말했다. 이어서 그는 “이번 대원제약과의 계약을 계기로, 제약은 물론 금융 및 헬스케어 등 내부 문서가 방대한 다른 산업 분야로의 시장 확대를 기대하고 있다”고 덧붙였다. 인공지능팩토리는 설립 이후 AI 분
SQL 코드 생성, 명령 이행 등 다양한 기준에서 만족할 만한 조건 충족해 스노우플레이크가 최고 수준의 개방성과 성능을 갖춘 엔터프라이즈급 대규모언어모델(LLM) ‘스노우플레이크 아크틱(Snowflake Arctic)’을 출시했다. 스노우플레이크 고유의 전문가혼합(MoE) 방식으로 설계된 아크틱은 동급 최고 성능과 생산성을 지원한다. 기업의 복잡한 요구사항 처리에도 최적화해 SQL 코드 생성, 명령 이행 등 다양한 기준에서 만족할 만한 조건을 충족한다. 특히 아크틱 LLM은 무료로 상업적 이용까지 가능한 아파치 2.0 라이선스로, 스노우플레이크는 AI 학습 방법에 대한 연구의 자세한 사항을 공개하며 엔터프라이즈급 AI 기술에 대한 새로운 개방 표준을 수립했다. 이 LLM은 스노우플레이크 아크틱 모델군의 일부로, 검색 사용을 위한 텍스트 임베딩 모델도 포함됐다. 슈리다 라마스워미(Sridhar Ramaswamy) 스노우플레이크 CEO는 “스노우플레이크 AI 연구팀은 AI 분야 최전방에서 혁신을 이끌며 자사에 중요한 전환점을 마련했다”며 “스노우플레이크는 오픈소스로 개선된 성능과 효율을 AI 커뮤니티에 공개하면서 오픈소스 AI가 지닌 가능성의 영역을 넓혀가고 있
최신 AI 기술 트렌드 및 비즈니스 융합 인사이트를 제시하는 ‘AI 융합 비즈니스 개발 컨퍼런스 2024(AI Tech 2024)’가 오는 5월 3일(금) 코엑스 3층 E홀에서 열린다. 올해로 7회째를 맞은 AI Tech 2024는 5월 1일부터 개최되는 국제인공지능대전(AI EXPO)의 대표 부대행사다. 기존에는 각 산업 AI 관련 관계자 및 개발자, 연구원, 대학생 등으로 구성된 참관객과 함께 AI 기반 비즈니스 개발 방법, AI가 적용된 비즈니스 사례 등을 통해 유의미한 인사이트를 공유해 왔다. AI Tech 2024에서는 ‘AI Frontier for AI Era’라는 주제로, 실질적인 AI 시장 환경 및 기술 현황에 대해 공유하고, AI 인프라부터 상용화에 이르는 로드맵 인사이트를 전달할 예정이다. 이와 함께 AI 적용 분야의 다양한 실증 사례로 비즈니스 아이디어를 제시한다. 오전 키노트 후 생성형 AI에 대한 정보와 인사이트를 공유하는 ‘Into the world of Generative AI' 에서는 업스테이지 박찬준 수석연구원의 'SOLAR, The Next Frontier in Large Language Models by Upstage and
최신 AI 기술 트렌드 및 비즈니스 융합 인사이트를 제시하는 ‘AI 융합 비즈니스 개발 컨퍼런스 2024(AI Tech 2024)’가 오는 5월 3일(금) 코엑스 3층 E홀에서 열린다. 올해로 7회째를 맞은 AI Tech 2024는 5월 1일부터 개최되는 국제인공지능대전(AI EXPO)의 대표 부대행사다. 기존에는 각 산업 AI 관련 관계자 및 개발자, 연구원, 대학생 등으로 구성된 참관객과 함께 AI 기반 비즈니스 개발 방법, AI가 적용된 비즈니스 사례 등을 통해 유의미한 인사이트를 공유해 왔다. AI Tech 2024에서는 ‘AI Frontier for AI Era’라는 주제로, 실질적인 AI 시장 환경 및 기술 현황에 대해 공유하고, AI 인프라부터 상용화에 이르는 로드맵 인사이트를 전달할 예정이다. 이와 함께 AI 적용 분야의 다양한 실증 사례로 비즈니스 아이디어를 제시한다. 오전 키노트 후 생성형 AI에 대한 정보와 인사이트를 공유하는 ‘Into the world of Generative AI' 에서는 업스테이지 박찬준 수석연구원의 'SOLAR, The Next Frontier in Large Language Models by Upstage and
아비바가 독일 하노버 산업 박람회(Hannover Messe)에서 마이크로소프트와의 협업을 통한 산업용 AI 어시스턴트를 선보였다. 마이크로소프트 애저 오픈AI 서비스(Microsoft Azure OpenAI Service)에서 실행되는 산업용 AI 어시스턴트는 인더스트리 5.0 혁신을 주도하는 가상의 ‘주제 전문가(SME)’다. 제조 산업 기업이 미션 크리티컬 환경에서 복잡한 질문에 답하는 방식에 대한 패러다임의 전환을 담았다. 아비바의 AI 어시스턴트는 가상 전문가 역할을 수행, 흩어진 데이터 세트에서 인사이트를 추출하는 방대한 작업을 간소화해 여러 단계의 복잡한 질문에 해답을 제공한다. 50년 이상 산업용 소프트웨어 및 분석 분야에서 쌓아온 아비바의 전문성을 활용하는 직관적인 인터페이스를 통해 대규모 언어 모델(LLM)과 생성형 AI를 활용할 수 있게끔 지원한다. 보안과 신뢰성을 위한 요소가 기본으로 내장되어 있으며 엄격한 엔지니어링 프롬프트와 교차 크리틱 방법론을 통해 분석 품질을 향상시켜 견고하고 투명한 답변을 제공하며, 출처와 인용을 참조하도록 보장한다. 데이터 보안 및 소유권을 보호하기 위해 독점 데이터는 LLM 또는 기타 타사 소스와 혼합되지
고객정보 포함한 대시보드에 접속할 때의 관리자 인증 강화 올거나이즈가 알리LLM앱 사용 시 옥타 인증을 적용하고, 플랫폼 관리자가 대시보드에 접속할 때도 이메일 2단계 인증을 거치도록 보안 인증을 강화한다고 23일 밝혔다. 기업 내 임직원들이 알리 플랫폼에 접속할 때 아이덴티티 보안 기업 옥타의 인증을 통해 로그인하도록 보안을 강화했다. IT 관리자가 옥타 인증을 활성화하면 바로 적용 가능하다. 옥타 인증 도입을 통해 알리 LLM 앱 마켓에서 앱을 다운 받아 활용할 때도 인증·인가 프로토콜 표준을 준수하며 안전하게 앱을 사용하도록 개선됐다. 또한, 옥타가 다양한 서비스에 연계돼 있기에 옥타 아이디·패스워드만으로 다양한 서비스에 로그인할 수 있다. 기업 고객 내 알리 플랫폼을 관리하는 IT 담당자가 대시보드에 로그인할 때도 2단계 인증(2FA, 2 Factor Authentication)을 받도록 로그인 절차를 업데이트했다. 대시보드 내 설정 메뉴에서 2단계 인증 기능을 활성화하면 기존 아이디·비밀번호 외에도 이메일로 받은 일회용 인증 코드를 추가 입력해야 한다. 민감한 고객정보를 포함한 대시보드에 접속할 때의 관리자 인증을 강화해 보안 우려를 해소한다는 목표
LG CNS가 ‘구글 클라우드 파트너 어워즈 2024’에서 한국의 ‘서비스 파트너(Services Partner of the Year)’로 2년 연속 선정됐다고 23일 밝혔다. 구글 클라우드 파트너 어워즈는 구글 클라우드와 협력해 고객에게 새로운 비즈니스 가치를 제공하며 뛰어난 성과를 달성한 디지털 혁신 선도기업에 수여된다. 시상은 서비스, 산업 솔루션, 공공, 사회적 영향 등 총 14개 부문으로 나뉘어 진행됐다. 서비스 부문은 고객 비즈니스 특성에 최적화된 구글 클라우드 전환을 통해 차별적인 서비스를 제공하고 고객의 사업 성공을 지원한 파트너 기업에게 주어지는 상이다. LG CNS는 지난해 클라우드, 데이터 플랫폼 등 구글 클라우드의 핵심 서비스를 적용해 고객의 DX혁신과 애플리케이션 현대화(AM, Application Modernization)를 선도한 점을 인정받았다. 게임, 물류, 유통, 제조 등 다양한 영역의 고객에게 맞춤형 서비스를 지원하며 차별적 고객가치를 제공했다. LG CNS는 지난해 국내 A기업이 구글 클라우드에서 자체 LLM(Large Language Model) 모델을 구축할 수 있도록 지원했다. 이를 통해 고객은 AI 모델 학습의 시행
별도의 원어민 성우 섭외나 추가 녹음 없이 여러 언어 구사 가능해 코난테크놀로지가 AI 성우 ‘코난보이스’에 최신 음성기술을 적용해 음성 AI 기술력을 한 단계 높였다. 코난보이스는 22일 사용자의 목소리를 다양한 언어로 변환하는 새로운 음성합성 모델을 공개했다. 발음기호를 언어마다 다르게 사용하는 대신 국제음성기호(IPA) 기반의 공통 발음기호를 사용해 한 사람의 목소리로 여러 언어의 음성 합성이 가능한 모델이다. 성우 고유의 억양과 음성 특성은 유지한 채 여러 외국어를 원어민에 가까운 수준으로 충실하게 합성해주며, 별도의 원어민 성우 섭외나 추가 녹음 없이도 여러 언어를 구사하는 것이 장점이다. 기존의 텍스트 기반 음성합성에서 진일보한 시도인 동시에, 다국어 음성합성에 대한 고객의 꾸준한 니즈를 반영했다. 현재 한국어 및 영어를 제공하며 추후 일본어, 중국어 등으로 늘려갈 계획이다. 최신 음성모델의 알고리즘은 기존 대비 크기가 콤팩트해졌으며 효율적으로 음성을 생성해 화자의 표현력을 손실 없이 구현하게 됐다. 플로우 기반의 최신 기법을 적용해 트랜스포머 신경망 모델 대비 연속성이 보강된 원활한 입출력 흐름으로 자연스러운 음성을 생성하게 됐다. 서비스도 업데
두 모델, 동급의 오픈소스 모델 중 최고 수준의 성능인 것으로 평가받아 메타가 다양한 목적으로 사용 가능한 최신 대규모 언어모델(LLM) ‘라마 3(Llama 3)’를 오픈소스로 공개했다. 메타의 차세대 대규모 언어모델 라마3는 사전훈련과 미세조정을 마친 80억 개(8B)와 700억 개(70B) 매개변수 모델 두 가지로 공개됐다. 이 두 모델은 현재 동급의 오픈소스 모델 중 최고 수준의 성능인 것으로 평가받는다. ‘대규모 다중작업 언어 이해(MMLU)’를 포함한 다양한 업계 표준 벤치마크에서 높은 성적을 받았으며 추론과 코드 생성, 지시 수행에 있어 전보다 성능이 크게 개선됐다. 라마3의 성능 향상은 모델의 사전 훈련과 사후 훈련 과정을 고도화함으로써 이뤄졌다. 사전 훈련을 위해 데이터셋의 양을 늘리고, 필터링 과정을 거쳐 고품질 데이터만을 선별했다. 라마3는 15조 이상의 토큰으로 훈련되었으며, 이는 라마2 대비 7배 이상 많으며 코드량은 4배 더 많다. 라마3의 사전 훈련에는 일상적인 질문부터 과학, 기술, 공학, 수학(STEM) 분야, 코딩, 역사 지식에 이르기까지 다양한 분야의 데이터셋이 사용되었다. 이를 통해 모델이 보다 여러 영역에서 활용될 수 있
총 13개 언어 지원하며 고객 반응이나 요구사항 반영해 언어 추가할 계획 코난테크놀로지가 SK텔레콤과 AI동시통역 솔루션 사업을 공동 전개한다. 코난테크놀로지는 다양한 외국어 서비스에 대한 생활 밀착형 수요가 급증함에 따라 지난해 최신 인공지능 음성 기술을 탑재한 동시통역 솔루션을 출시했다. 서울교통공사와 함께 명동역 시범설치를 시작으로 현재 종로5가역, 시청역, 광화문역, 경복궁역, 이태원역, 강남역 등 주요 역사에 구축됐다. 이어 이달 SKT와 공동판매 파트너십을 체결, 양측의 기술력과 영업망을 활용해 외국인 이용 수요에 적극적으로 대응할 방침이다. 협약에 따라 AI동시통역 솔루션은 ‘트랜스 토커’라는 명칭으로 판매된다. 트랜스 토커는 외국인 관광객이 투명 스크린 앞에 설치된 마이크에 본인의 언어로 질문하면 한국어로 번역된 문장이 안내데스크 담당자 스크린에 표시되고, 이후 담당자가 한국어로 답변하면 이 내용이 실시간으로 관광객 언어로 변환돼 모니터에 나타나는 방식이다. 지원하는 언어는 총 13개며 고객 반응이나 요구사항 등을 반영해 지원 언어를 추가할 계획이다. 이렇듯 다양한 언어 지원과 실시간 통역이 최대 장점으로 지하철역 외에도 호텔, 카지노, 백화점
자동화 LLM 기반 채팅형 AI 에이전트 서비스 ‘고두(GO;DO)’ 발표 완전한 오토메이션 비전 내세워...AI 검증 역량 강조 “정보 제공하거나, 계획 수립 제시하는 것 뛰어넘는 실행력 갖춘 AI 서비스 론칭” 산업 자동화의 고도화 속도가 매섭다. 산업 현장은 물론이고, 실생활 전반에 이르는 자동화 실현은 현재진행형이다. 여기에 인공지능(AI)이 산업 내 최신 트렌드로 자리 잡으면서 AI와 융합된 자동화의 발전 속도는 가속도가 붙은 상황이다. 이 흐름은 일상 및 업무 프로세스 자동화 기술에도 영향을 미쳤다. 특히 AI를 기반으로 한 거대언어모델(LLM)이 등장하며 일상과 업무에서의 새로운 패러다임을 제시했다. LLM은 수많은 데이터 학습을 기반으로, 데이터의 맥락을 파악해 질문에 대한 해답을 생성하는 기능을 수행한다. 사용자는 이를 통해 적절한 아이디어 및 인사이트를 얻을 수 있게 됐다. 이렇게 산업 성장에 한 획을 그었다고 평가되는 이 모델에도 한계는 존재한다. 김계관 그리드원 대표는 “기존 LLM 기반 서비스는 키워드 기반으로 일정한 형식의 답변만을 도출하는 한계가 존재했다”며 “비정형 프로세스를 자동화하는 것이 근본적 숙제”라고 분석했다. 그리드원은