GPT-3의 파라미터 수는 1750억 개. 한때 이 수치는 AI의 위용을 상징했다. 하지만 2025년 현재, 그런 숫자 놀이는 더 이상 중요하지 않다. AI 기술의 중심축이 바뀌고 있다. ‘얼마나 학습했는가’에서 ‘얼마나 빠르게 반응하고 정확하게 추론하는가’로 말이다. OpenAI의 o3, 구글의 Gemini 1.5, 마이크로소프트의 Phi-3, 메타의 LLaMA3까지, 최근 공개된 모든 신형 모델은 공통적으로 ‘추론 최적화’를 전면에 내세운다. 한마디로 말해, 지금의 AI는 더 이상 천천히 생각하는 철학자가 아니라, 실시간 대응하는 전술가여야 한다. AI 성능 기준의 변화 이른바 GPT로 대표되는 LLM은 통계적으로 가장 가능성 높은 답을 과거 학습 데이터를 기반으로 예측하는 구조다. 이른바 ‘확률적 언어 생성기’다. 하지만 여기엔 한계가 있었다. 새로운 상황에 대한 실시간 판단, 문맥에 따른 논리적 전개, 시각 정보와 복합 입력의 해석 등에서는 유연하지 못했다. 그런 의미에서 AI 성능은 오랫동안 ‘얼마나 많은 데이터를 학습했는가’, ‘모델의 크기가 얼마나 큰가’로 측정됐다. GPT-4는 GPT-3 대비 수배의 연산량을 요구했고, 이를 학습하기 위해선 수
"LDS 장비 영업 확대와 함께 오존수 공급장치의 시장 안착이 가속화할 것" 에이치엠넥스가 반도체 증착공정장비 기업인 에스엠아이(SMI)의 지분 91.15%를 인수하며 최대주주로 올라섰다. 주식 대금 265억 원 지급을 완료한 에이치엠넥스는 이번 거래로 자기주식을 제외한 사실상 100%의 경영권을 확보했다. 에스엠아이는 SK하이닉스의 핵심 공정에 사용되는 증착 화합물 공급시스템(LDS, Liquid Chemical Delivery System) 장비를 공급해 온 중견 소부장 기업이다. 2024년 기준 매출액 259억 원, 영업이익 15억 원을 기록했으며, 전체 매출의 70% 이상이 SK하이닉스향이다. 이번 인수는 반도체 고도화 흐름에 발맞춘 포석으로 풀이된다. 특히 SK하이닉스가 최근 세계 최초로 고대역폭메모리(HBM) 6세대 ‘HBM4 12단’ 샘플을 엔비디아에 납품한 가운데, 에스엠아이가 10년 이상 증착 및 세정공정 장비를 공급한 바 있어, 관련 수혜 가능성이 주목받고 있다. 에스엠아이는 국내 최초로 Cell 방식의 오존수 공급장치 ‘LIMPIO’를 개발하고 SK하이닉스에 1호기를 성공적으로 납품했다. 이 장치는 반도체·디스플레이 산업에서 유해 화학물질
美 의회, 반도체 밀수 방지 위한 추적 기술 도입 명목으로 법안 발의 예정 미국이 엔비디아와 AMD 등 자국 반도체 기업이 생산한 고성능 AI 칩이 중국 등 수출 규제 대상 국가로 유입되는 것을 막기 위해 칩 단위 위치 추적 및 작동 차단 기술을 의무화하는 법안을 추진한다. 초당적 공감대가 형성되고 있어 입법화 가능성에도 무게가 실리고 있다. 5일(현지시간) 로이터통신에 따르면, 민주당 소속 빌 포스터 연방 하원의원은 반도체 밀수 방지를 위한 추적 기술 도입을 골자로 한 법안을 조만간 발의할 예정이다. 법안에는 상무부가 6개월 내 관련 규정과 기준을 마련하도록 요구하는 내용이 포함된다. 특히 법안은 반도체에 위치 추적 기술을 탑재하는 것은 물론, 해당 칩이 중국과 같이 수출이 금지된 국가 내에 있는 것으로 확인될 경우에는 부팅 자체를 막는 보안 기술을 함께 적용하도록 하고 있다. 포스터 의원은 “AI 칩이 중국 공산당이나 인민해방군의 무기 설계 및 AI 작업에 사용될 수 있다는 우려는 추측이 아닌 현실의 문제”라며 “현재 시점에서 시급히 대응하지 않으면 전략 기술이 의도치 않게 경쟁국으로 흘러들어가는 상황이 반복될 것”이라고 경고했다. 이는 최근 중국 기업들
지정학적 리스크 대응 전략이 성패 주요 변수로 작용할 것으로 보여 AMD가 인공지능(AI) 수요 증가에 힘입어 시장 전망을 웃도는 1분기 실적을 기록했다. 그러나 미국 정부의 수출 규제로 인한 중국 시장 매출 타격이 본격화하면서, 향후 실적 불확실성은 여전하다는 평가다. AMD는 6일(현지시간) 발표한 2024년 1분기 실적 보고서를 통해 매출 74억4000만 달러(약 10조3000억 원), 조정 주당순이익(EPS) 0.96달러를 기록했다고 밝혔다. 이는 금융정보업체 LSEG가 집계한 월가 평균 전망치(매출 71억3000만 달러, EPS 0.94달러)를 모두 상회하는 수치다. 작년 동기 대비 매출은 36% 증가했으며, 영업이익률도 11%로 전년 대비 10%포인트 상승했다. 이 가운데 AI 반도체 수요가 몰린 데이터 센터 부문이 전체 성장을 견인한 것으로 나타났다. 해당 부문 매출은 37억 달러로, 전년 동기 대비 57% 급증하며 AMD 실적 전반을 끌어올렸다. 리사 수 AMD CEO는 “AI 및 데이터 센터 중심의 성장세가 4분기 연속 이어지며 전년 동기 대비 실적 가속화를 달성했다”며, “인프라 측면에서 고객들의 지속적인 투자도 긍정적으로 작용하고 있다”고
재판부 "회사뿐 아니라 국가 산업기반에도 심각한 악영향 미쳐" SK하이닉스의 핵심 반도체 기술을 빼돌린 혐의로 기소된 중국 국적 전직 직원이 항소심에서 1심보다 훨씬 무거운 형을 선고받았다. 재판부는 이번 범죄를 단순한 산업 스파이 행위를 넘어, 국가 산업경쟁력과 안보를 위협하는 중대한 침해로 판단했다. 7일 수원고등법원 형사2-1부는 산업기술보호법 위반 혐의로 기소된 A씨(37세, 중국 국적)에 대해 징역 5년과 벌금 3000만 원을 선고하며 원심을 파기했다. 1심에서는 징역 1년 6개월, 벌금 2000만 원에 그쳤으나, 항소심 재판부는 형량을 대폭 상향했다. 재판부는 “피고인은 SK하이닉스의 기술이 집약된 문서를 무단 유출해 경쟁사 이직에 활용했고, 이는 수년간 축적된 연구개발 성과와 영업비밀이 포함된 국가 핵심기술에 해당한다”고 밝혔다. 이어 “해당 자료는 기술적·경제적 가치가 크고, 유출 피해는 회사뿐 아니라 국가 산업기반에도 심각한 악영향을 미친다”고 덧붙였다. 재판부는 “이 같은 범죄는 산업안보 측면에서 강력한 경각심을 줘야 하며 엄중한 처벌이 불가피하다”고 판시했다. 또한, “피고인이 범행을 부인하고 있으며, 피해 기업 또한 엄벌을 요청하고 있는
은밀한 유해표현, 설득력 등 다양한 지표를 통해 AI의 잠재 위험성 탐지 에임인텔리전스가 연세대학교, KIST, 서울대학교와 공동으로 개발한 AI 안전성 진단 체계 ‘ELITE(Enhanced Language-Image Toxicity Evaluation)’가 머신러닝 학술대회인 'ICML 2025'에 공식 논문으로 채택됐다. 이는 국내 연구진이 글로벌 AI 안전성 연구 흐름을 선도하는 신호탄으로 해석된다. ICML(International Conference on Machine Learning)은 인공지능 및 머신러닝 분야에서 가장 권위 있는 학회 중 하나로, 매년 전 세계 연구자들이 최신 기술을 발표하고 교류하는 자리다. 올해로 42회를 맞이한 이 학회에 국내 연구팀의 논문이 이름을 올린 것은, 한국 기술력의 실질적 성과가 국제적으로 공론화됐다는 점에서 의미가 깊다. ELITE는 이미지와 텍스트를 함께 입력받는 비전언어모델(VLM)의 응답을 ‘정밀 진단’하는 평가 체계다. 단순히 노골적인 표현만을 걸러내는 기존 방식에서 나아가, 겉보기에 문제가 없는 응답 속에서도 은밀한 유해 표현, 설득력, 구체성 등 다양한 지표를 통해 AI의 잠재 위험성을 탐지한다.
전시회서 치타, 가젤, 세렝게티 등 세 가지 핵심 솔루션 소개 예정 에이프리카가 오는 5월 14일부터 16일까지 서울 코엑스에서 개최되는 ‘AI EXPO SEOUL 2025’에 참가해 폐쇄망 환경에서도 구축 가능한 Private AI Agent 솔루션을 공개한다. 에이프리카는 이번 전시를 통해 산업 맞춤형 RAG 프레임워크와 운영 자동화 체계를 결합한 프라이빗 AI 통합 플랫폼을 선보인다. 'Build Your Own Private AI Agent'라는 슬로건 아래, 외부 네트워크가 차단된 기업 환경에서도 신속하게 자체 AI 에이전트를 구현하는 방안을 제시할 계획이다. 에이프리카는 이번 전시에서 치타(Cheetah), 가젤(Gazelle), 세렝게티(Serengeti) 등 세 가지 핵심 솔루션을 소개한다. 치타는 데이터 수집부터 모델 개발, 배포, 인프라 운영까지 AI 개발의 전 과정을 아우르는 MLOps·LLMOps 통합 플랫폼이다. 다양한 컴퓨팅 환경에서 안정성과 확장성을 보장하며, 기업이 원하는 형태의 AI 워크로드를 빠르게 구축하고 운영하도록 지원한다. 가젤 RAG는 건설, 금융, 공공 등 산업별 요구에 맞춘 에이전틱 RAG 프레임워크다. 프라이빗 환
맞춤형 에이전트 구축, 멀티 에이전트 오케스트레이션 등 하이브리드 기술 생태계 공유 IBM이 연례 기술 컨퍼런스 ‘THINK 2025’를 통해 기업용 AI 도입의 새로운 기준을 제시했다. 이번 발표의 핵심은 AI가 단순한 챗봇을 넘어 실제 업무를 수행하는 ‘에이전트’로 진화하며, 이를 실무에 적용할 수 있도록 지원하는 통합 플랫폼 ‘왓슨x 오케스트레이트’의 강화다. IBM은 기업이 보유한 데이터, 다양한 IT 환경, 복잡한 애플리케이션을 효과적으로 연결해주는 AI 기반 업무 자동화 도구를 중심으로 IBM은 맞춤형 에이전트 구축, 멀티 에이전트 오케스트레이션, 가시성 확보 및 거버넌스 관리까지 포괄하는 하이브리드 기술 생태계를 공개했다. 왓슨x 오케스트레이트는 비개발자도 손쉽게 업무용 AI 에이전트를 생성하도록 직관적인 노코드 인터페이스를 제공한다. 동시에 숙련 개발자는 프로코드 환경에서 복잡한 API 연동이나 커스터마이징이 가능하다. IBM은 이 같은 유연성을 통해 기업 내 다양한 부서와 역할의 사용자가 각자의 요구에 맞는 AI 에이전트를 빠르게 생성하고 적용할 수 있다고 설명한다. 왓슨x는 인사, 영업, 구매 등 핵심 비즈니스 분야에 즉시 적용 가능한 사전
자체 개발한 하이브리드 추론 기능으로 처리 효율 극대화해 알리바바 클라우드가 오픈소스 대규모 언어모델(LLM) 신제품군 ‘큐원3(Qwen3)’를 공개하며 생성형 AI 경쟁에서 다시 한 번 존재감을 드러냈다. 이번 시리즈는 모바일부터 자율주행까지 다양한 AI 활용 환경을 겨냥해 설계됐으며, 사고 기반 하이브리드 추론 등 새로운 구조로 성능과 효율성 모두를 잡았다는 평가다. 큐원3는 총 6종의 밀집 모델(0.6B, 1.7B, 4B, 8B, 14B, 32B)과 2종의 전문가 혼합(MoE) 모델(30B 중 3B 활성, 235B 중 22B 활성)로 구성된다. 모든 모델은 깃허브, 허깅페이스, 모델스코프를 통해 누구나 자유롭게 활용 가능하며, 곧 API 형태로도 서비스될 예정이다. 큐원3의 가장 큰 특징은 알리바바가 자체 개발한 하이브리드 추론 기능이다. 복잡한 논리 추론이나 수학, 코딩과 같은 다단계 작업에는 사고 기반 추론 모드를, 빠른 응답이 필요한 일반 대화에는 비사고 기반 추론 모드를 자동 전환해 처리 효율을 극대화한다. 개발자는 API 상에서 최대 3만8000개의 토큰까지 사고 지속 길이를 조절할 수 있어, 성능과 리소스의 균형을 자유롭게 맞출 수 있다. 큐
GPU 리소스 자동 스케줄링, 초단위 배포 환경 구성, 고병렬 추론 테스트 등 핵심 기능 공개 예정 케이투스(KAYTUS)가 오는 5월 14일부터 16일까지 서울 코엑스에서 개최되는 ‘AI EXPO KOREA 2025’에 참가해 자사의 AI DevOps 소프트웨어 ‘MotusAI’와 통합형 AI DevOps 인프라 솔루션을 선보인다. 케이투스는 이번 전시를 통해 복잡한 AI 인프라 운영 환경에서 효율적인 리소스 관리와 빠른 모델 배포를 가능케 하는 턴키 기반의 엔드투엔드 솔루션을 집중 조명할 예정이다. 생성형 AI 기술이 학습 단계를 넘어 실시간 추론과 대규모 배포로 확산되는 가운데, 기업들은 GPU 활용률 저조, 데이터 병목 현상, 느린 배포 속도 등 AI 운영상의 다양한 장애물에 직면하고 있다. 케이투스는 이러한 과제를 해결하기 위해 AI DevOps 플랫폼 ‘MotusAI’를 중심으로 한 통합 클러스터 시스템을 통해 모델 개발부터 배포, 운영까지 전 과정을 안정적이고 간결하게 연결하는 인프라 해법을 제시한다. 전시 부스에서는 MotusAI 기반 클러스터를 활용해 한 명의 운영자가 딥러닝 모델과 추론 서비스를 5분 이내에 배포하는 실시간 데모가 진행된다.
최태원 회장 "고객 신뢰는 그룹 존재 이유...재발 방지 마련에 최선 다할 것" 최근 발생한 SK텔레콤의 사이버 침해 사고로 인해 전국적으로 고객 불편과 혼란이 이어진 가운데, SK그룹이 국민과 고객을 향해 공식 사과의 뜻을 밝혔다. 최태원 SK그룹 회장은 7일인 오늘 오전 서울 중구 을지로 SK텔레콤 사옥에서 열린 'SKT 사이버 침해 사고' 관련 데일리 브리핑에 참석해 사과문을 발표했다. 최태원 회장은 그룹 차원의 보안체계 전면 점검과 함께 외부 전문가가 참여하는 ‘정보보호혁신위원회’를 구성해 근본적 재발 방지책 마련에 나서겠다고 강조했다. 최 회장은 발표한 입장문을 통해 “고객과 국민 여러분께 불편과 불안을 초래한 점, 진심으로 사과드린다”고 밝히며, 특히 사고 초기의 미흡한 소통과 대응에 대해 경영진 차원의 깊은 반성과 책임 의식을 드러냈다. SK그룹은 사고 당시 매장을 찾거나 해외 출국을 앞둔 고객이 겪은 불편을 언급하며, “세심한 고객 대응이 부족했던 점은 경영진 모두가 뼈아프게 반성할 부분”이라고 인정했다. 이어 “언론과 국회, 정부기관의 지적 역시 겸허히 수용하겠다”고 덧붙였다. 이번 사태의 재발을 막기 위한 SK그룹 차원의 후속 조치도 공개됐
조용진 파네시아 부사장, 행사에서 CXL 3.x 기반의 인프라 구축 사례와 응용 방향 제시 파네시아가 ‘CXL DevCon 2025’에서 고출력 CXL 3.x 스위치 기반 프레임워크를 선보이며 글로벌 기술 무대에서 존재감을 드러냈다. 파네시아는 올해 국내 기업 중 유일하게 해당 행사에 전시 기업으로 참여했다. 미국 캘리포니아 산타클라라에서 4월 29일부터 이틀간 열린 이번 행사는 CXL(Compute Express Link) 표준을 주도하는 CXL 컨소시엄이 주관하는 글로벌 컨퍼런스로, 케이던스, 텔레다인 르크로이 등 주요 회원사가 대거 참여해 차세대 고속 인터커넥트 기술을 선보였다. 파네시아가 이번에 선보인 고출력 CXL 3.x 스위치는 CPU, GPU, 메모리 등 다양한 장치를 하나의 시스템으로 통합해주는 브릿지 역할을 수행한다. 고유의 저지연 IP 기술을 기반으로 설계된 해당 스위치는 멀티 레벨 스위칭, 포트 기반 라우팅을 모두 지원하며, 장치 연결 수를 극대화함으로써 평균 홉 수를 줄이고 시스템 지연시간을 최소화하는 것이 특징이다. 이러한 기술은 특히 고성능 컴퓨팅(HPC)과 대규모 AI 응용 환경에서 효율적인 자원 활용과 저비용 고성능 인프라 구현을
LG디스플레이가 미국 새너제이에서 열리는 세계 최대 디스플레이 전시회 ‘SID 2025’에 참가해 미래 모빌리티 시대를 겨냥한 차세대 차량용 디스플레이를 대거 선보인다. 올해 전시 주제는 ‘신기술을 통한 사업 확대(Driving the Future)’로, LG디스플레이는 차량 내 다양한 영역을 디스플레이화할 수 있는 솔루션과 폼팩터 혁신 기술을 집중 소개한다. LG디스플레이는 차량 센터페시아 영역에 적용 가능한 '스트레처블 디스플레이 솔루션'을 공개했다. 이 제품은 화면이 최대 50%까지 유연하게 늘어나면서도 100ppi 해상도와 RGB 풀컬러를 구현하며, 손가락 터치 시 버튼이 물리적으로 솟아오르는 터치 반응형 인터페이스도 구현할 수 있다. 이는 버튼과 디스플레이가 분리돼 있던 기존 센터페시아 디자인의 한계를 넘어선다. 초대형 일체형 디스플레이인 '필러투필러(Pillar to Pillar)' 솔루션은 운전석부터 조수석까지 대시보드를 가로지르는 57인치 단일 패널로 구현됐으며, 주행 정보부터 엔터테인먼트 콘텐츠까지 모두 고화질로 제공할 수 있다. 이 제품은 지난해 LG디스플레이가 40인치 제품을 세계 최초로 상용화한 데 이은 확장판이다. 함께 선보인 18인치
리벨리온 김광정 사업총괄, '한국형 AI를 위한 추론 인프라'를 주제로 발표 진행 리벨리온이 오는 5월 15일 개최되는 ‘AI 융합 비즈니스 개발 컨퍼런스 2025(AI Tech 2025)’에 참가해 '한국형 AI를 위한 추론 인프라'를 주제로 발표한다. AI Tech 2025는 ‘Your Fine-Tuning Roadmap’을 주제로, 파인튜닝 이후 기업 현장에서 AI를 어떻게 실질적으로 활용할 것인지에 초점을 맞춘다. 생성형 AI의 확산 속에서 많은 기업이 겪는 운영상의 고민과 실무자의 현장 요구에 대응하도록 최신 기술 트렌드와 구체적인 적용 사례가 공유된다. 발표자로 참여하는 리벨리온 김광정 사업총괄은 "에이전틱 AI와 SLM(Small Language Model)의 부상으로, 새로운 형태의 AI 인프라에 대한 논의가 활발해지고 있다. 이번 발표에서는 SLM 기반 AI 인프라가 주목받는 배경과 이를 뒷받침하는 고성능·고효율 AI 추론 솔루션과 기술적 요소를 살펴보고자 한다. 아울러, 실제 데모 사례를 통해 한국형 AI 인프라 구축의 가능성과 방향성을 함께 제시한다"고 밝혔다. 국내 AI 반도체 개발을 주도하는 리벨리온은 최근 일본 도쿄에 첫 해외 법인을
리벨리온 김광정 사업총괄, '한국형 AI를 위한 추론 인프라'를 주제로 발표 진행 리벨리온이 오는 5월 15일 개최되는 ‘AI 융합 비즈니스 개발 컨퍼런스 2025(AI Tech 2025)’에 참가해 '한국형 AI를 위한 추론 인프라'를 주제로 발표한다. AI Tech 2025는 ‘Your Fine-Tuning Roadmap’을 주제로, 파인튜닝 이후 기업 현장에서 AI를 어떻게 실질적으로 활용할 것인지에 초점을 맞춘다. 생성형 AI의 확산 속에서 많은 기업이 겪는 운영상의 고민과 실무자의 현장 요구에 대응하도록 최신 기술 트렌드와 구체적인 적용 사례가 공유된다. 발표자로 참여하는 리벨리온 김광정 사업총괄은 "에이전틱 AI와 SLM(Small Language Model)의 부상으로, 새로운 형태의 AI 인프라에 대한 논의가 활발해지고 있다. 이번 발표에서는 SLM 기반 AI 인프라가 주목받는 배경과 이를 뒷받침하는 고성능·고효율 AI 추론 솔루션과 기술적 요소를 살펴보고자 한다. 아울러, 실제 데모 사례를 통해 한국형 AI 인프라 구축의 가능성과 방향성을 함께 제시한다"고 밝혔다. 국내 AI 반도체 개발을 주도하는 리벨리온은 최근 일본 도쿄에 첫 해외 법인을