시마에이아이(SiMa.ai)가 지난 12일(현지시간) 피지컬 AI 확산을 가속화할 세 가지 신제품을 공개했다. 이번 발표에는 차세대 머신러닝 시스템온칩(MLSoC) ‘모달릭스(Modalix)’의 양산 개시, 주요 GPU 벤더와 핀 호환되는 시스템온모듈(SoM)과 개발 키트 출시, 그리고 대규모 언어모델(LLM)과 생성형 AI 모델을 손쉽게 온디바이스에서 실행할 수 있는 소프트웨어 프레임워크 ‘엘리마(LLiMa™’가 포함됐다. 모달릭스는 2세대 MLSoC로, 10W 미만의 전력으로 LLM, 트랜스포머, 합성곱신경망(CNN), 생성형 AI 워크로드를 구동할 수 있도록 설계됐다. Arm 기반 아키텍처와 네이티브 생성형 AI 스택을 탑재해 실시간 인식과 의사결정, 자연어 상호작용을 지원하며, 카메라·이더넷·PCIe 등 주요 인터페이스를 모두 지원한다. 로보틱스, 자동차, 산업 자동화, 항공·방위, 스마트 리테일, 의료 등 다양한 산업에 적용 가능하다. 시마에이아이는 시놉시스(Synopsys)의 AI 기반 전자설계자동화(EDA)와 IP 포트폴리오, 아키텍처 설계·에뮬레이션 솔루션을 활용해 첫 실리콘 제작 단계부터 결함 없는 A0 칩을 구현했다. 제조에는 TSMC의 N
딥엑스가 삼성파운드리, 가온칩스와 2나노 공정 계약을 체결하고 차세대 생성형 AI 온디바이스 반도체 ‘DX-M2’ 개발에 착수했다. 이로써 딥엑스는 삼성파운드리의 2나노 공정을 사용하는 상용 고객이 됐다. DX-M2는 초저전력 환경에서 대규모 생성형 AI 모델을 실시간으로 추론할 수 있도록 설계된 차세대 AI 반도체다. 시제품 제작을 위한 MPW(다중 프로젝트 웨이퍼)는 2026년 상반기 생산에 들어가며, 양산은 2027년을 목표로 하고 있다. 이번 프로젝트는 국내 팹리스 산업의 고부가가치 반도체 생태계 확대와 2나노 시스템 반도체 조기 상용화에 기여할 것으로 기대된다. 딥엑스는 기존 5나노 공정 기반 DX-M1 대비, GAA(Gate-All-Around) 구조의 2나노 공정에서 전성비(성능 대비 전력 효율)가 약 두 배 향상된다는 점에 주목했다. 생성형 AI는 막대한 연산량으로 인해 전력 소모와 발열이 큰데, 전성비는 온디바이스 AI 구현의 핵심 지표로 꼽힌다. 지난해 11월부터 삼성 2나노 공정의 전력 효율, 성능, 제조원가, 수율 등을 분석한 결과, DX-M2가 목표 성능을 충족할 수 있다고 판단했다. 딥엑스는 이미 5나노 공정으로 비전 AI 특화 제품
오케스트로가 생성형 AI 솔루션 ‘클라리넷(CLARINET)’으로 GS인증 1등급을 획득했다. 이번 인증으로 공공과 민간 시장 공략에 속도를 낼 계획이다. GS인증은 국내 소프트웨어 품질을 종합 평가하는 국가 공인 제도로 기능성·신뢰성 등 모든 항목에서 최고 수준을 충족한 제품에만 1등급이 부여된다. 클라리넷은 조직 내 축적된 문서를 기반으로 사용자의 질문에 실시간 답변을 제공하는 생성형 AI 챗봇 솔루션이다. 검색증강생성(RAG) 방식과 출처 기반 응답 구조를 적용해 할루시네이션을 최소화해 답변 시 관련 문서를 함께 제시해 신뢰도를 높인다. 규정·매뉴얼·정책 자료 등 복잡한 문서를 읽고 분석해 민원 응대, 고객 상담, 내부 지침 안내와 같은 반복 업무를 효율화한다. 이 솔루션은 온프레미스와 클라우드형(SaaS) 모두 지원하며 PDF, HWP, Word 등 다양한 문서 형식과 최대 300MB 대용량 문서를 처리할 수 있다. 자체 기술로 개발돼 내부망에서도 안전하게 운영 가능하며, 드래그 앤 드롭 방식의 직관적인 인터페이스를 통해 비전문가도 손쉽게 챗봇을 구성할 수 있다. 클라리넷은 한국건설기술인협회, 광주과학기술원, 한국행정연구원 등 공공과 연구기관에 도입돼
포티투마루가 차세대 AI 인재들과의 만남을 위해 ‘2025 SW중심대학 디지털 경진대회’ 본선 무대에 오른다. 대회는 8월 12일 서울 대한상공회의소에서 열리며, 전국 58개 SW중심대학 학생들이 최신 소프트웨어와 인공지능 기술을 활용해 사회적 문제 해결 방안을 제시하는 자리다. 올해 본선에는 SW 부문과 AI 부문에서 각각 12개 팀, 총 150여 명의 대학생이 진출했다. 이들은 발표 평가를 통해 작품을 선보이고, 포스터 세션과 네트워킹을 통해 교류를 이어간다. 후원사로 참여한 포티투마루는 기업 소개 세션을 통해 최신 AI 기술 동향과 산업 현장에서 요구되는 역량을 전할 예정이다. 포티투마루 김한수 CTO는 초경량 언어모델(sLLM)과 검색증강생성(RAG) 기술의 발전 방향을 소개하며, AI 개발 과정에서 기술 구현뿐 아니라 문제 정의, 데이터 해석, 서비스 기획 역량이 필수적임을 강조한다. 그는 “기술적 완성도뿐 아니라 사회적 가치와 사용자 경험까지 고려할 수 있는 엔지니어가 되어야 한다”는 메시지를 전달할 계획이다. 포티투마루는 이번 대회에서 ‘후원기업상’을 시상하며, 수상팀에게는 자사 채용 시 서류전형 면제 혜택을 제공한다. 시상식은 오후 5시부터 진
코난테크놀로지가 최신 생성형 AI 기반 음성인식 솔루션으로 국민건강보험공단의 스마트 회의록 작성 업무를 지원한다. 회사는 지난달 ‘코난 STT’를 건강보험 클라우드 표준 플랫폼 구축 사업 내 스마트 회의실에 공급하기로 확정했다. 이번 도입으로 공단은 회의 내용을 실시간으로 기록·정리하는 효율성을 높일 수 있을 것으로 기대된다. 코난 STT는 10만 시간 이상의 고품질 대규모 음성 데이터를 학습하고 최신 대규모 언어모델(LLM) 아키텍처를 적용해 성능을 향상시킨 것이 특징이다. 자체 한국어 다영역 성능 평가에서 95%대 문자인식률(Character Accuracy)을 기록했으며, 이는 동종 업계 최상위권 수준이다. 평가에는 Common Voice v19, TEDx KR, FLUERS, Zeroth Korean, AI-Hub 전문분야 심층인터뷰 등 5종의 공개 벤치마크와 함께 드라마, 인터넷 강의 음성 데이터를 포함한 총 7종의 데이터셋이 활용됐다. 이 과정에서 화자 특성과 주변 잡음 등 다양한 환경 요소를 반영해 신뢰성을 확보했다. 코난테크놀로지는 이번 공급을 계기로 공공기관뿐 아니라 다양한 산업군으로 생성형 AI 음성인식 솔루션 적용 범위를 넓힌다는 계획이다
뤼튼테크놀로지스(이하 뤼튼)가 8일 오전부터 오픈AI의 최신 플래그십 초거대 언어 모델(LLM) ‘GPT-5’를 무료 무제한으로 제공하기 시작했다. 이번 조치는 오픈AI가 같은 날 새벽(한국 시간) GPT-5를 공개한 직후 단행됐다. 오픈AI에 따르면 GPT-5는 기존 일반 모델과 추론 모델을 한 단계 업그레이드해 통합한 버전으로, 정확성과 대화 자연스러움이 강화됐다. 무료 서비스 이용 시에는 사용량 제한이 적용되지만, 뤼튼은 이를 무제한으로 개방해 유료 사용자와 동일한 수준의 성능을 모든 이용자가 누릴 수 있도록 했다. 뤼튼은 자사 앱과 웹 서비스에 ‘GPT-5’ 전용 메뉴를 신설해 접속 경로를 간소화했다. 이를 통해 누구나 추가 비용 없이 최신 GPT-5의 기능을 제한 없이 사용할 수 있다. 뤼튼은 지난해 GPT-4 공개 당시에도 국내에서 가장 빠르게 무료 무제한 제공을 시작한 바 있다. 이세영 대표는 “모든 국민이 비용 부담 없이 AI를 활용할 수 있도록 돕는 것이 창립 초기부터의 목표”라며 “이번 GPT-5 무제한 무료 제공 역시 AI 혜택을 폭넓게 확산하기 위한 노력”이라고 밝혔다. 업계에서는 이번 조치가 국내 AI 서비스 경쟁을 촉진하고, 이용자
오픈AI가 차세대 플래그십 모델 ‘GPT-5’를 출시했다. 이번 모델은 전작 대비 정확성, 속도, 활용성을 모두 끌어올린 통합형 프런티어 AI로, 별도의 모델 선택 없이 최적의 답변을 제공하도록 설계됐다. GPT-5는 추론 과정에서의 오류(환각)를 줄여 신뢰성과 정확성을 높였으며, 새로운 안전 응답 기능을 도입했다. 이를 통해 사용자의 질문이 민감하거나 제한적인 경우에도 단순 거부 대신 가능한 범위 내에서 도움을 제공하고, 지원이 어려운 경우 그 이유를 명확히 설명한다. 코딩 분야에서는 지금까지 공개된 모델 중 최고 성능을 보이며, 프론트엔드 디자인에도 강점을 갖췄다. 코딩 경험이 없는 사용자도 웹사이트, 앱, 게임을 손쉽게 제작할 수 있다. 글쓰기 기능 역시 문맥 적응력과 표현력을 개선해 실제 업무 환경에서의 활용도가 높아졌다. 헬스케어 영역에서는 건강 관련 질문에 대한 이해도와 설명 능력이 향상됐다. 검사 결과 해석, 진료 전 질문 준비, 치료 옵션 비교 등 의료 의사결정 지원 기능이 강화됐다. 다만 OpenAI는 GPT-5가 의료 전문가를 대체하지 않는다는 점을 분명히 했다. GPT-5는 모든 사용자 계층에 배포된다. 무료 사용자도 GPT-5와 경량 버
아마존웹서비스(AWS)가 OpenAI의 오픈 웨이트 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’를 아마존 베드록과 아마존 세이지메이커 AI를 통해 제공한다고 7일 밝혔다. 이를 통해 AWS 고객은 고성능 AI 모델을 기반으로 생성형 AI 애플리케이션을 보다 빠르고 유연하게 구축할 수 있게 됐다. OpenAI의 새로운 오픈 웨이트 파운데이션 모델 2종은 추론 성능과 효율성을 갖춘 최신 LLM으로, AWS의 글로벌 클라우드 인프라를 통해 수백만 고객에게 제공된다. 특히 gpt-oss-120b는 아마존 베드록에서 실행 시 제미니(Gemini) 대비 10배, 딥시크-R1(DeepSeek-R1) 대비 18배, OpenAI o4 모델 대비 7배 높은 가격 대비 성능을 제공한다고 AWS는 설명했다. 아마존 베드록을 통해 고객은 OpenAI 모델 기반 AI 에이전트를 손쉽게 배포하고, 보안·확장성을 갖춘 프로덕션 환경에서 운영할 수 있다. 보안 장치를 구성해 유해 콘텐츠의 최대 88%를 차단하는 ‘가드레일(Guardrails)’ 기능도 제공된다. 향후 커스텀 모델 임포트, 지식 베이스, 모델 커스터마이제이션 기능도 추가 지원될 예정이다. 아마존 세이지메이커
엔비디아가 오픈AI와 함께 새로운 오픈 웨이트(open-weight) AI 추론 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’ 개발에 참여했다. 이번 협력은 전 세계 개발자, 기업, 스타트업, 정부 등이 첨단 AI 기술을 직접 활용할 수 있는 개방형 모델 보급에 속도를 내기 위한 것이다. 오픈AI는 현지 시간 5일 두 모델을 공개하며, 산업과 규모를 불문하고 생성형 AI, 추론형 AI, 피지컬 AI, 헬스케어, 제조 등 다양한 분야에서 활용 가능하다고 밝혔다. gpt-oss 모델은 엔비디아 H100 GPU로 훈련됐으며, 전 세계 수억 개의 쿠다(CUDA) 기반 GPU에서 최적의 추론 성능을 발휘하도록 설계됐다. 모델은 현재 엔비디아 NIM 마이크로서비스 형태로 제공돼 GPU 가속 인프라 어디서든 배포할 수 있다. 데이터 프라이버시와 엔터프라이즈급 보안 기능을 제공하며, 차세대 엔비디아 블랙웰(Blackwell) 플랫폼에 최적화돼 GB200 NVL72 시스템에서 초당 150만 토큰 처리 성능을 구현한다. 젠슨 황 엔비디아 CEO는 “오픈AI는 엔비디아 AI 위에서 혁신을 이뤄왔고, 이번 gpt-oss 모델 공개는 전 세계 개발자들이 오픈소스 기반으
오케스트로가 과학기술정보통신부의 ‘독자 AI 파운데이션 모델’ 프로젝트에 참여하며 공공 부문 특화 생성형 AI 서비스 개발에 본격 나선다. 오케스트로는 업스테이지가 주관하는 컨소시엄의 핵심 파트너로 최종 선정됐으며 공공 분야 생성형 AI 서비스 구축을 전담한다. 이번 사업은 높은 해외 기술 의존도를 극복하고 한국형 AI 기술 자립 기반을 마련하기 위한 정부 주도의 전략적 프로젝트다. 총 15개 민간 컨소시엄이 지원했고 서류 및 발표 평가를 통해 5개 팀이 ‘국가대표 AI’ 정예팀으로 최종 선정됐다. 오케스트로가 속한 업스테이지 컨소시엄은 KAIST·서강대학교·플리토·노타AI·래블업 등 국내 기술 및 연구기관과 함께 구성된 스타트업 중심 연합체로, 글로벌 수준의 AI 파운데이션 모델 ‘솔라 WBL’을 개발한다. 오케스트로는 이번 프로젝트에서 공공기관 환경에 특화된 데이터를 기반으로 RAG(Retrieval-Augmented Generation) 방식의 대규모 언어모델 서비스를 전담한다. 오케스트로는 다수의 공공기관 프로젝트 경험을 기반으로 행정과 정책 현장에 맞춤화된 AI 서비스를 구현해 공공 부문에서의 생성형 AI 활용을 확대할 계획이다. 오케스트로의 클라우
크라우드웍스가 과학기술정보통신부가 추진하는 ‘독자 AI 파운데이션 모델 프로젝트’에 참여 중인 5개 개발팀에 공동 데이터를 제공하는 공식 공급사로 참여한다고 5일 밝혔다. 이번 프로젝트는 네이버, LG AI연구원, NC AI, SK텔레콤, 업스테이지 등 5개 개발팀이 선정되어 ‘국가대표 AI’ 모델 개발에 나서는 정부 주도 대형 사업이다. 정부는 해당 프로젝트에 총 328억 원 규모의 데이터 지원 예산을 투입하며, 이 중 공동 데이터 구매에만 100억 원이 책정됐다. 크라우드웍스는 이 공동 데이터 공급 역할을 수행하며, 각 개발팀이 필요로 하는 AI 학습 데이터셋을 맞춤형으로 제공할 예정이다. 크라우드웍스는 국내 최대 규모의 AI 데이터 구축·검수 체계를 갖춘 기업으로, 특히 이번에는 저작권 이슈를 해결한 고품질 도서 데이터셋, 국내외 뉴스 데이터, 국어학 기반 언어자료 외에도 국내에서 수급이 어려운 ‘STEM(과학·기술·공학·수학)’ 데이터셋을 포함한 고차원 전문 지식 데이터를 공급한다. 이들 데이터는 AI의 추론력, 분석력, 문해력 고도화에 필수적인 자원으로, 고성능 파운데이션 모델 학습에 중요한 기반이 될 것으로 기대된다. 크라우드웍스는 모든 데이터를
포티투마루가 5일 인천 쉐라톤 그랜드 호텔에서 열린 ‘APEC 2025 KOREA 글로벌 디지털·AI 포럼’에 참가해 공공 부문에서의 생성형 AI 전환, 이른바 ‘공공 AX(AI Transformation)’ 혁신 사례를 발표했다. APEC 21개국의 디지털·AI 장관회의 공식 부대행사로 열린 이번 포럼에서, 포티투마루는 한국형 신뢰 기반 생성형 AI 기술을 기반으로 행정·국방·지자체·보건 등 다양한 공공 영역에서의 실제 적용 사례를 공유했다. 포티투마루는 국내 최초로 공공(TTA CAT)과 민간(AIIA AI-MASTER) 인증을 모두 획득한 독자 언어모델 LLM42와, 검색증강생성(RAG) 기반의 RAG42 기술을 중심으로 전시를 구성했다. ‘Trustworthy Answering AI’를 주제로 한 이번 전시에서는 범정부 초거대 AI 공통기반 사업, 국방군수 LLM 구축, 전국민 심리케어 상담사 보조 시스템, 부산시 생성형 AI 행정서비스 실증 사례 등 실제 현장에서 작동 중인 ‘일하는 방식의 혁신’을 집중 소개했다. 김동환 대표는 “APEC 포럼은 한국형 공공 AX 기술의 글로벌 전파 가능성을 확인할 수 있는 상징적인 자리”라며 “포티투마루는 경량형·
셀렉트스타가 과학기술정보통신부 주관 ‘독자 AI 파운데이션 모델’ 개발 프로젝트의 최종 지원 대상으로 선정됐다. 셀렉트스타는 SK텔레콤이 주관하는 컨소시엄에 참여하며, AI 모델의 신뢰성과 안전성을 책임지는 핵심 데이터 기술 기업으로 자리매김하게 됐다. 이번 컨소시엄은 크래프톤, 포티투닷, 리벨리온, 라이너 등 각 분야를 대표하는 기업과 서울대, KAIST 등 학계가 함께한 국내 최대 규모의 AI 연합으로, 반도체부터 서비스까지 AI 밸류체인을 포괄하는 풀스택 생태계 구현을 목표로 한다. 셀렉트스타는 컨소시엄 내에서 AI 모델 학습을 위한 고품질 데이터 구축은 물론, 모델 안정성 검증을 위한 레드티밍 데이터 설계와 평가 체계를 총괄한다. 특히 국내 최초로 자체 개발한 LLM 신뢰성 검증 솔루션 ‘다투모 이밸(Datumo Eval)’과 AI 레드팀 챌린지 운영 경험을 결합해, 모델의 잠재적 취약점을 사전에 식별하고 방어하는 체계를 제공한다. 셀렉트스타는 ‘생성형 AI 레드팀 챌린지’의 선도 운영사이자, MWC 2025에서 개최되는 ‘글로벌 AI 레드팀 챌린지’의 운영 기관으로도 참여하며, 이미 국제적으로 기술력을 인정받은 바 있다. 이번 프로젝트에서는 그간 쌓
업스테이지가 과학기술정보통신부가 추진하는 ‘독자 AI 파운데이션 모델 개발’ 사업에 최종 선정됐다. 총 15개 팀이 참여한 가운데 서류와 발표 평가를 거쳐 선발된 5개 정예팀 중 유일한 스타트업으로 이름을 올리며, 기술력과 실행력을 동시에 입증했다. 업스테이지는 이번 과제에서 ‘유형 1’에 해당하는 신규 독자 모델 개발 트랙에 참여한다. 자체 아키텍처와 학습 알고리즘을 처음부터 설계하고 구현하는 방식으로, 글로벌 수준의 프런티어 모델 완성을 목표로 삼고 있다. 모델은 향후 1,000억~3,000억 파라미터 규모로 확장되며, 한국어·영어·일본어·동남아 언어를 아우르는 다국어 처리, 멀티모달 대응, 산업 특화형 모델 개발 등으로 단계적 확장을 추진한다. 이번 프로젝트를 위해 업스테이지는 민간·학계·연구기관이 참여하는 산학연 컨소시엄을 구성했다. GPU 인프라와 학습 최적화 부문에서는 래블업(GPU 가상화 기술), 노타 AI(경량화 및 최적화), 플리토(데이터 전처리 및 품질 평가)가 함께하고, 카이스트와 서강대학교 소속 교수진은 연구 협력과 인재 양성, 국제 논문 출판 등을 통해 학술적 뒷받침에 나선다. 특히 업스테이지는 산업 현장 중심의 활용 확산에도 방점을
라이너가 과학기술정보통신부가 추진하는 ‘독자 AI 파운데이션 모델’ 프로젝트에서 SK텔레콤이 주관하는 정예 컨소시엄의 핵심 기술 기업으로 선정됐다. 이번 프로젝트는 글로벌 경쟁력을 갖춘 한국형 AI 모델의 자체 개발을 목표로, 반도체부터 서비스까지 풀스택 AI 생태계 구축을 본격화하는 국가 전략 사업이다. SKT 컨소시엄은 SK텔레콤을 중심으로 서울대학교, KAIST 등 학계와 함께 크래프톤, 리벨리온, 포티투닷, 라이너 등 각 분야 대표 기업들이 참여하는 민관 연합 체제로 구성됐다. AI 반도체, 학습·추론 인프라, 데이터셋, 서비스까지 AI 밸류체인의 전 주기를 아우르는 구조로, 기존 프로젝트들과 차별화되는 통합 접근 방식을 지향한다. 라이너는 이 컨소시엄 내에서 ‘정확한 AI 검색 및 정보 탐색 특화 기술 기업’ 역할을 맡는다. 주요 참여 범위는 실사용 데이터를 기반으로 한 AI 학습용 데이터셋 제공, 검색 결과의 정확도를 판단하는 Ranker 모델 기반 평가 시스템 구축, 문장 단위 신뢰도 검증을 위한 모듈 설계 등이다. 이를 통해 생성형 AI의 고질적 문제로 지적돼 온 ‘환각(Hallucination)’을 줄이고, 한국형 AI 모델의 신뢰성과 실용성