사전 학습만으로 높은 성능 발휘하고, 추가 튜닝으로 특정 작업에 특화할 수 있어 오노마에이아이는 9월 30일 일러스트레이션 전용 거대 모델 '일러스트리우스 0.1 버전(Illustrious 0.1)'을 허깅페이스에 공개했다. 공개 직후, 일러스트리우스는 허깅페이스 트렌딩 모델 기준 102만9925개의 모델 중 10월 7일 기준 7위를 기록했으며, civitAI 플랫폼에서는 2위를 기록하며 전 세계적으로 큰 주목을 받았다. 오노마에이아이는 관련 기술 내용을 arxiv에 공개해 연구와 산업적 활용 가능성에 대한 관심을 끌고 있다. 일러스트리우스는 이미지 생성에 대한 방대한 지식을 바탕으로 한 첫 오픈소스 일러스트레이션 모델로, 파인튜닝 및 개인화를 통해 사용자가 원하는 대로 커스터마이즈할 수 있는 강점을 갖고 있다. 기존 모델이 여러 개념이나 복합적인 요소에 대한 조합 능력에서 제한을 보이는 반면, 일러스트리우스는 거의 사전 학습만으로도 높은 성능을 발휘해 다양한 용도로 활용되며, 추가 튜닝을 통해 특정 작업에 특화되는 유연성도 제공한다. 단순히 고성능 오픈소스 모델이라는 점을 넘어, 일러스트리우스는 파인튜닝이 가능한 자산으로서 공개된 것이 큰 의의를 갖는다.
언어모델 ‘Cerebro-BM-solar’가 평균 71.09점으로 1위 차지해 아이브릭스는 허깅페이스에서 운영하는 ‘Open-Ko-LLM 리더보드’에서 자체 개발 대규모 언어모델(LLM)로 1위를 달성했다고 24일 밝혔다. Open-Ko-LLM 리더보드는 한국어 LLM 모델 성능을 평가하는 벤치마크다. 추론능력, 상식능력, 언어 이해 종합능력, 환각현상 방지능력, 한국어 상식생성능력 등 다섯 가지 기준으로 평가해 순위를 매긴다. 현재까지 약 1713개의 언어모델이 참여했으며, 대기업부터 스타트업까지 치열하게 경쟁하는 이 리더보드에서 아이브릭스의 언어모델 ‘Cerebro-BM-solar’가 평균 71.09점으로 1위를 차지했다. 특히 환각현상 방지능력(Ko-TruthfulQA)과 상식능력(Ko-HellaSwag) 부문의 점수는 각각 86.02점, 81.18점으로 높은 평가를 받았다. Cerebro-BM-solar는 두 개의 SOLAR 언어모델을 융합하고 파인튜닝해 개발된 모델로, 매개변수 107억 개의 적은 파라미터로도 뛰어난 성능을 보여줌으로써 경제성까지 입증했다. 최근 전 세계적으로 글로벌 기업이 매개변수가 적은 모델로 개발 방향을 바꾸는 추세에서 저렴한
클라우드플레어는 허깅페이스에서 클릭 한 번으로 클라우드플레어의 글로벌 네트워크에 AI 애플리케이션을 배포할 수 있도록 지원한다고 밝혔다. 클라우드플레어는 워커스 AI(Workers AI)를 일반 사용자도 이용할 수 있게 됨에(General Availability, GA) 따라, 허깅페이스 허브와 통합되어 모델 배포를 지원하는 최초의 서버리스 추론 파트너가 된다. 이로써 개발자가 인프라를 관리하거나 사용하지 않는 컴퓨터 용량에 대한 비용을 지불할 필요없이 전 세계를 대상으로 빠르고 쉽고 경제적으로 AI를 배포할 수 있도록 지원한다는 방침이다. AI 혁신의 급속한 진전에도 불구하고 AI가 가진 잠재력과 기업에 선사하는 가치 사이에는 여전히 간극이 존재한다. 조직과 개발자는 GPU 또는 인프라를 설정 및 관리하거나 유지보수할 필요 없이도 합리적인 가격에 신속하게 실험하며 또 이 과정을 반복할 수 있어야 한다. 기업은 속도, 보안, 성능, 통합 가시성, 규정 준수를 지원하는 간편한 플랫폼을 통해 혁신적인 애플리케이션을 고객에게 더 빠르게 제공할 수 있어야 한다. 매튜 프린스 클라우드플레어 CEO 겸 공동 창업자는 "최근 생성형 AI 붐으로 인해 다수의 기업들이 AI
MoMo-70B, 700억 개 파라미터 가진 거대언어모델로 성능 증명해 모레가 자체 개발한 거대언어모델(LLM)이 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’ 평가에서 77.29점이라는 높은 점수를 기록하며 글로벌 1위에 올랐다. 허깅페이스 오픈 LLM 리더보드는 글로벌 AI 모델의 성능 검증 창구로 활용되는 개발형 플랫폼이다. 현재 3400개가 넘는 모델이 등록돼 추론, 상식 능력, 언어 이해 능력 등 6가지 평가 지표를 기준으로 순위를 다투고 있다. 이번에 1위에 오른 모레의 최신 모델 'MoMo-70B'은 700억 개의 파라미터를 가진 거대언어모델로 지난 17일 처음 리더보드 1위에 올라 현재까지 자리를 지키고 있다. 모델 개발 착수에서 1위 달성까지 단 3개월 만에 거둔 성과다. 모레가 이처럼 단기간에 LLM 분야에서 세계 1위의 두각을 나타낼 수 있었던 데는 모레가 자체 개발 및 보유하고 있는 AI 플랫폼 ‘MoAI’의 기술력이 뒷받침됐기 때문이다. 최고 수준의 LLM을 빠르게 개발하기 위해서는 무엇보다 효율적인 모델 학습 방법을 확보하는 것이 중요한데 모레의 MoAI 플랫폼은 고도의 병렬화 처리 기법을 통해 대규모 AI 모델을
300억 매개변수 이하 사이즈로 글로벌 최고 성능 모델에 꼽혀 업스테이지가 자체 개발한 사전학습 LLM(Large Language Model) ‘Solar(이하 솔라)'를 공개하며 글로벌 LLM 대전에 본격적으로 참전한다. 업스테이지는 14일 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’에서 세계 1위를 차지한 사전학습 LLM 솔라를 공개했다고 밝혔다. 이번 결과는 소형 LLM(SLM)의 기준이라고 할 수 있는 300억 매개변수(30B) 이하 사이즈로 글로벌 최고 성능 모델에 올라 더욱 의미가 깊다. 업스테이지 솔라는 ‘Specialized and Optimized Llm and Applications with Reliability’의 약자로, 업스테이지는 지난 8월, 오픈LLM 역사상 최초로 GPT-3.5의 벤치마크 점수를 뛰어넘어 주목을 받은 자사의 허깅페이스 1위 모델을 시작으로 솔라 모델을 개발했다. 허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상 방지, 대명사 참조 및 수학 해결 능력 등 6가지 지표의 평균 점수로
알리바바 클라우드는 자체 개발한 거대언어모델(LLM) '통이치엔원(Tongyi Qianwen)'의 720억 개 파라미터 버전 '큐원(Qwen)-72B'와 18억 개 파라미터 버전인 '큐원-1.8B'을 자사AI 모델 커뮤니티 '모델스코프'와 협업 AI 플랫폼 '허깅페이스'에 오픈소스로 공개했다고 5일 밝혔다. 징런 저우알리바바 클라우드 CTO는 "오픈소스 생태계를 구축하는 것은 LLM 및 AI 애플리케이션 개발에 매우 핵심적인 일"이라며 "알리바바 클라우드는 가장 개방적인 클라우드로서 모든 사람이 생성형 AI 역량을 활용할 수 있도록 하는 것을 목표로 한다"고 말했다. 그는 이어 "이러한 목표를 달성하기 위해 자사의 최첨단 기술을 공유하고 파트너들과 함께 오픈소스 커뮤니티의 발전을 촉진해 나갈 것"이라고 밝혔다. 큐원-72B은 3조 개 이상의 토큰으로 사전 학습돼 주요 오픈소스 모델들을 10가지 벤치마크 부문에서 초월한다. 대표적으로 앞선 벤치마크 부문은 대규모 다중작업 언어이해(MMLU, Massive Multi-task Language Understanding), 코드 개발 역량 테스트인 휴먼이발(HumanEval) 및 수학 문제를 푸는 GSM8K 등이 있
전문가로부터 듣는 AI 관련 세션과 데모 부스 행사 진행돼 비영리 머신러닝 커뮤니티 가짜연구소가 SK MySUNI와 협력해 주최한 ‘제7회 슈도콘(7th PseudoCon)’이 지난 11일(토) 그랜드워커힐서울 컨벤션센터에서 약 200명이 참석한 가운데 성황리에 막을 내렸다. ‘AI 대격변에서의 우리들의 성장’이라는 주제로 열린 이번 컨퍼런스에는 허깅페이스, 마키나락스(MakinaRocks), 구글 클라우드, HP, 정보통신산업진흥원(NIPA) 등이 후원사로 참여했다. 행사 기획에는 총괄 김찬란 가짜연구소 대표(SK텔레콤), 프로그램 위원장 한수민(플루토랩스), 데모부스 좌장 안성진(마이크로소프트)이 주도적으로 참여했다. 컨퍼런스는 김찬란 대표의 개회사로 문을 열었다. 이어 구글, 뉴블라, LG전자, 인포시스, 크래프톤, 서울대학교, 성균관대학교 등에 소속된 AI 엔지니어가 경험을 공유하는 6개의 기여 세션과 마키나락스의 산업 AI 전문가로부터 ML옵스(MLOps)를 기반으로 데이터 과학자의 AI 모델 개발과 관리 노하우를 듣는 1개 초대 세션이 진행됐다. 컨퍼런스 메인 행사가 끝난 이후에는 NHN, 하나투어, 캐치테이블, VoyagerX, Rebuilder
앞서 아마존도 40억달러 투자키로…MS는 오픈AI에 140억달러 투자 세계 최대 검색엔진 업체 구글이 챗GPT 개발사 오픈AI의 경쟁사인 인공지능(AI) 스타트업 앤스로픽에 최대 20억 달러(2조7천억원)를 투자한다고 월스트리트저널(WSJ)이 27일(현지시간) 보도했다. WSJ은 소식통을 인용해 구글이 앤스로픽에 5억 달러를 우선 투자했으며, 이후 추가로 15억 달러를 투자하기로 합의했다고 전했다. 구글은 이미 올해 초 앤스로픽에 5억5천 달러를 투자한 것으로 알려졌다. 구글의 이번 투자는 지난달 세계 최대 전자상거래 업체 아마존이 앤스로픽에 최대 40억 달러를 투자하기로 한 것과는 별개다. 아마존은 앤스로픽에 초기 투자금으로 12억5천만달러를 제공하고, 향후 일정 조건에 따라 최대 40억달러까지 투자액을 늘리기로 한 것으로 전해졌다. 이에 따라 AI 기술을 둘러싼 경쟁이 한층 치열해질 전망이다. 마이크로소프트(MS)는 이미 오픈AI에 140억 달러를 투자해 지분 49%를 확보했다. 구글과 아마존도 앤스로픽에 각각 20억 달러와 40억 달러를 투자하게 된다. 구글과 아마존이 갖는 지분 규모는 알려지지 않았다. 앤스로픽은 작년 11월 말 챗GPT를 공개해 전
한국어 데이터 확보 및 공유로 한국문화 정서를 담아내는 LLM 개발에 주력 업스테이지는 14일 한국어 데이터 부족 문제를 해결하고, 고성능 LLM(Large Language Model, 거대 언어 모델) 개발을 통한 대한민국 LLM의 독립을 위해 ‘1T 클럽’을 발족한다고 밝혔다. 1T 클럽은 ‘1 Trillion 토큰 클럽’을 줄인 것으로 텍스트, 책, 기사, 보고서, 논문 등 다양한 형태의 1억 단어 이상의 한국어 데이터를 기여하는 파트너사로 구성된다. 업스테이지는 이달 초 자사가 개발한 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’ 평가 점수에서 72.3점을 획득, 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 1위를 차지하며 주목받았다. 허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 알려져 있다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각 현상 방지 등 4가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다. 현재 업스테이지는 73점을 돌파하는 모델을 배포, 세계 1, 2위 모델을 독식하고 있다. 1T 클럽은 한국어 데이터의 부족 문제 해결과
트웰브랩스가 CB인사이트가 처음으로 발표한 '세계 50대 생성형 AI 스타트업'에 국내 기업으로 단독 선정됐다. 트웰브랩스는 11일 CB인사이트의 세계 50대 생성형 AI 스타트업에 오픈AI, 미드저니, 허깅페이스, 코히어 등 AI 기업들과 함께 이름을 올렸다고 11일 밝혔다. CB인사이트는 챗GPT 등장으로 시작된 생성형 AI 시장 확장에 따라 지난해와 올해 '세계 100대 AI 기업'을 발표한 데 이어 이번에 50대 생성 AI 스타트업을 처음 선정했다. CB인사이트는 독창성과 기술의 참신함, 비즈니스 성과, 인재 수준과 연구개발 및 투자 실적, 시장 내 위치 등을 고려해 회사를 선정했다고 설명했다. 트웰브랩스는 영상 이해를 위한 초거대 AI 모델을 자체 개발해 영상 검색, 분류, 생성 등 기능을 다른 AI 기업이 활용할 수 있는 응용프로그램 인터페이스(API) 형태로 제공한다. 이 회사는 올해 하반기 미국 라스베이거스에서 열리는 '오라클 클라우드 월드'에서 영상 이해에 특화된 생성형 AI 모델과 신규 API 기능을 공개할 계획이다. 헬로티 서재창 기자 |
트랜스포머 계열 AI 모델에 대한 AI 반도체 최적화 및 서비스 솔루션 공동 개발 추진 퓨리오사AI가 AI 플랫폼 ‘허깅페이스’와 협력해 차세대 AI 반도체 개발을 가속화한다. 양사는 챗GPT와 같은 초거대 언어 모델뿐 아니라 비전, 음성 등 다양한 어플리케이션 영역에 걸쳐 트랜스포머 계열의 인공지능 모델을 차세대 AI 반도체에 최적화하고 이를 효율적으로 서비스하는 솔루션을 공동 개발 중이다. 퓨리오사AI의 차세대 AI 반도체 출시 시점에 맞춰 글로벌 AI 기업 대상의 비즈니스도 함께 추진할 계획이다. 허깅페이스는 챗GPT 와 같은 AI 모델의 근간이 되는 트랜스포머를 대중화시킨 플랫폼으로, 허깅페이스 트랜스포머 라이브러리는 일평균 100만 이상의 다운로드를 기록하고 있다. 구글, 마이크로소프트 등 전 세계 1만3000개 이상의 기업 고객이 허깅페이스를 사용 중이다. 퓨리오사AI가 개발 중인 차세대 AI 반도체는 챗GPT 등 트랜스포머 계열의 대규모 언어모델을 지원하는 인퍼런스 칩이다. 대량의 데이터를 한 번에 처리하도록 3세대 고대역폭메모리 D램 ‘HBM3’을 탑재할 예정이다. 현재 디자인 설계를 마쳤고, 2024년 상반기에 5nm 선단 공정에서 양산하는