자체 완전 관리형 모델 실행 및 사용 사례에 가장 적합한 모델 쉽게 찾아 아마존웹서비스(이하 AWS)는 오늘 손쉽게 첨단 생성형 인공지능(AI) 애플리케이션과 경험을 개발하도록 지원하는 아마존 베드록의 신규 혁신 기능을 발표했다. AWS는 이미 수만 명의 고객이 자사 생성형 AI 전략의 기반으로 아마존 베드록을 선택했다고 밝혔다. 생성형 AI 애플리케이션을 신속하게 구축하고 배포하는 데 필요한 기능, 엔터프라이즈급 보안과 더불어 AI21랩스, 앤스로픽, 코히어, 메타, 미스트랄AI, 스태빌리티AI, 아마존 등에서 제공하는 주요 파운데이션 모델(FM)에 대한 광범위한 액세스를 제공하기 때문이다. 아마존 베드록에서 제공하는 모델을 완전 관리형 서비스로 제공하므로, 고객은 기본 인프라에 대한 고민 없이도 애플리케이션 운영에 있어 원활한 배포와 확장성, 지속적인 최적화를 확보한다. 이번 신규 기능을 통해 고객은 아마존 베드록에서 자체 완전 관리형 모델을 실행하고, 사용 사례에 가장 적합한 모델을 쉽게 찾고, 생성형 AI 애플리케이션에 더 쉽게 보호 기능을 적용하며, 더 많은 모델 선택권을 제공받게 됐다. AWS는 스타트업부터 보안에 가장 민감한 기업이나 정부 기관에
엔비디아가 신규 소프트웨어 엔비디아 텐서RT-LLM(NVIDIA TensorRT-LLM)을 출시했다고 12일 밝혔다. 대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로 사용하기 어려울 수 있다. 엔비디아는 대규모 언어 모델 추론을 가속화하고 최적화하기 위해 메타, 애니스케일, 코히어, 데시, 그래머리, 미스트럴 AI, 현재 데이터브릭스로 인수된 모자이크ML, 옥토ML, 탭나인, 투게더 AI, 우버 등 주요 기업들과 긴밀히 협력하고 있다. 이러한 혁신은 몇 주 내로 출시 예정인 오픈 소스 소프트웨어인 엔비디아 텐서RT-LLM에 통합됐으며, 암페어(Ampere), 러브레이스(Lovelace)와 호퍼(Hopper) GPU에서 사용할 수 있다. 텐서RT-LLM은 텐서RT 딥 러닝 컴파일러로 구성되며 최적화된 커널, 전처리와 후처리 단계, 멀티 GPU/멀티 노드 통신 프리미티브를 포함해 엔비디아 GPU에서 획기적인 성능을 제공한다. 이를 통해 개발자는 C++ 또는 엔비디아 쿠다(CUDA)에 대한 전문적인 배경 지식 없이도 최고의 성능과 빠른 사용자 정의 기능을 제공하는 새로운
오라클이 전 세계 기업 조직을 위한 강력한 생성형 AI 서비스 개발 계획을 발표했다. 오라클은 기업용 AI 플랫폼 기업인 코히어와의 협업으로 네이티브 환경에서 생성형 AI 서비스를 제공함으로써, 기업 조직이 비즈니스 전과정의 프로세스 자동화 및 의사결정 개선, 고객 경험 향상을 이루도록 지원할 계획이다. 오라클 생성형 AI 서비스는 오라클 클라우드 인프라스트럭처(OCI)를 기반으로 구축되고, 오라클의 독창적인 수퍼클러스터 기능을 활용한다. 애플리케이션에서부터 인프라스트럭처에 이르기까지 전반에 적용될 예정이며, 업계 최고 수준의 보안 및 성능, 가치 제공을 목표로 삼고 있다. 클레이 마고요크(Clay Magouyrk) 오라클 클라우드 인프라스트럭처 총괄 부사장은 “첨단 보안 및 동급 최강의 데이터 관리 기능과 모든 종류의 비즈니스 문제를 해결할 수 있는 통합 클라우드 애플리케이션 포트폴리오를 갖춘 오라클만이 생성형 AI를 위한 완전한 엔드투엔드 플랫폼을 제공한다”고 말했다. 이어 그는 “코히어와의 협력으로, 고객은 생성형 AI를 자사 비즈니스에 손쉽게 도입한다. 고객은 코히어의 기반 모델을 통해 보유한 데이터를 안전하게 통합해 특정 모델의 훈련에 활용하며, O
기업이 다양한 목적으로 사용할 수 있는 생성형 AI 기술 개발 진행 오픈AI와 경쟁하는 AI 스타트업 코히어(Cohere)는 8일(현지시간) 2억7000만 달러의 투자를 유치했다고 밝혔다. 캐나다 토론토에 본사를 둔 코히어는 기업용 생성형 AI 개발 스타트업으로, 구글의 딥러닝 AI 연구팀인 구글 브레인 출신의 아이단 고메즈와 닉 프로스트가 2019년 창업했다. 코히어의 이번 펀딩은 지금까지의 투자금 1억7500만 달러를 크게 웃도는 규모다. 총 유치 금액도 4억4500만 달러로 늘어났다. 이번 펀딩에는 AI 칩으로 큰 주목을 받는 엔비디아를 포함해 오라클과 세일즈포스 등 미국의 대기업도 포함됐다. 이들 기업이 각각 얼마의 자금을 투자하기로 했는지는 알려지지 않았다. 코히어는 GPT와 같은 대규모 언어 모델을 기반으로 기업들이 다양한 목적으로 사용할 수 있는 생성형 AI 기술을 개발하고 있다. 특정 대규모 언어 모델에 데이터가 쏠리는 것에 대한 기업의 우려를 해소하는 데 초점을 두면서 오픈AI와 차별화하고 있다. 코히어 최고경영자 고메즈는 성명에서 "AI는 앞으로 10년간 기업 비즈니스 성공의 핵심이 될 것"이라며 "생성 AI에 대한 관심이 비즈니스를 가속하