인텔, 메타의 라마 3.1로 AI 제품 성능 최적화 추진해

URL복사

인텔은 메타의 최신 LLM인 라마 3.1에 데이터 센터, 엣지 및 클라이언트 AI 제품 전반에 걸친 성능 데이터 및 최적화를 제공한다. (출처 : 게티이미지뱅크)

라마 3.1 405B 포함해 다양한 규모와 기능에서 새로운 업데이트 모델 제공

인텔은 메타의 최신 대규모 언어 모델(LLM)인 라마 3.1에 데이터 센터, 엣지 및 클라이언트 AI 제품 전반에 걸친 성능 데이터 및 최적화를 제공한다고 밝혔다. 인텔은 ‘AI 에브리웨어’ 전략을 위해 AI 소프트웨어 생태계에 지속적으로 투자하며, 새로운 모델이 인텔의 AI 하드웨어에 최적화하도록 보장하고 있다.

메타는 지난 4월 라마 3 출시에 이어, 지난 23일(현지 시각) 현재까지 가장 성능이 뛰어난 모델인 라마 3.1을 출시했다. 라마 3.1은 공개적으로 사용 가능한 가장 큰 파운데이션 모델인 라마 3.1 405B(4050억 개 모델)를 포함해 다양한 규모와 기능에서 여러 새로운 업데이트 모델을 제공한다.

이 새로운 모델들은 파이토치 및 인텔 파이토치 익스텐션, 딥스피드, 허깅 페이스 옵티멈 라이브러리, vLLM 등 개방형 생태계 소프트웨어를 통해 인텔 AI 제품에서 활성화 및 최적화된다. 또한 생태계 전반에서 최고의 혁신을 활용하는 개방형, 멀티 벤더, 강력하고 컴포저블한 생성형AI 솔루션을 만들기 위한 LF AI 및 데이터 재단의 새로운 오픈 플랫폼 프로젝트인 OPEA 역시 이 모델들을 지원한다.

라마 3.1 다국어 LLM 컬렉션은 8B, 70B, 405B 크기의 사전 학습 및 조정된 생성 모델 컬렉션으로, 모든 모델은 8개 구술어에 걸쳐 긴 컨텍스트 길이(128k)를 지원한다. 라마 3.1 405B는 일반 지식, 조작성, 수학, 도구 사용 및 다국어 번역에 있어 최첨단 기능을 갖추고 있다. 이를 통해 커뮤니티는 합성 데이터 생성 및 모델 증류와 같은 새로운 기능을 활용하게 될 것으로 보인다.

인텔 가우디 AI 가속기는 생성형 AI 및 LLM의 고성능 가속을 위해 설계됐다. 405B 모델의 초기 성능 측정은 각 8개의 가우디 2 가속기를 갖춘 두 노드에서 수행됐다. 인텔 가우디 소프트웨어의 성숙성 덕분에 사용자는 새로운 라마 3.1 모델을 쉽게 실행하고 빠르게 추론 결과를 생성할 수 있다.

인텔 제온 프로세서는 일반 컴퓨팅의 유비쿼터스 백본으로, 전 세계적으로 강력한 컴퓨팅 자원에 쉽게 접근할 수 있다. 현재 모든 주요 클라우드 서비스 제공업체에서 사용 가능한 인텔 제온 프로세서는 AI 성능을 새로운 수준으로 끌어올린 AI 엔진, ‘인텔 어드밴스드 매트릭스 익스텐션(AMX)’을 모든 코어에 탑재하고 있다.

벤치마킹 결과에 따르면, 1000개의 토큰 입력 및 128개의 토큰 출력으로 라마 3.1 8B 모델을 실행하면 5세대 인텔 제온 플랫폼에서 초당 176개의 토큰 처리량을 달성할 수 있으며, 토큰의 지연 시간을 50ms 이하로 유지할 수 있다.

인텔 코어 울트라 프로세서와 인텔 아크 그래픽이 탑재된 AI PC는 클라이언트와 엣지에서 뛰어난 온디바이스 AI 추론 성능을 제공한다. 인텔 코어 플랫폼의 NPU와 아크 GPU의 인텔 Xe 매트릭스 익스텐션 가속과 같은 특화한 AI 하드웨어를 통해 AI PC에서 경량화한 파인튜닝 및 애플리케이션 맞춤화가 쉬워졌다. 로컬 연구 개발을 위해 파이토치 및 인텔 파이토치 익스텐션과 같은 개방형 생태계 프레임워크가 활성화하고 가속화했다. 생산 단계에서는 인텔의 오픈비노 툴키트를 활용해 AI PC에서 효율적인 모델 배포 및 추론을 수행한다. AI 워크로드는 최적의 성능을 위해 CPU, GPU, NPU 간에 원활하게 배포될 수 있다.

인텔의 AI 플랫폼과 솔루션은 엔터프라이즈용 AI RAG 배포를 가속화한다. OPEA의 창립 회원 중 하나인 인텔은 엔터프라이즈용 AI를 위한 개방형 생태계 구축에 앞장서고 있다. OPEA가 라마 3.1 모델을 활용해 성능을 최적화했다는 점이 주목할 만하다.

OPEA는 엔터프라이즈용 오픈소스, 표준화 및 모듈화한 이기종 RAG 파이프라인을 제공한다. 이는 구성 및 설정 가능한 멀티 파트너 요소를 기반으로 구축된다. 이 평가에서는 OPEA 청사진에 마이크로 서비스가 배포됐다. E2E RAG 파이프라인은 LLM 추론에 라마 3.1을 사용하며, 임베딩에는 BAAI/bge-base-en-v1.5가 사용되고, 벡터 DB에는 레디스가 사용되며, 오케스트레이션에는 쿠버네티스가 사용된다.

결론적으로, 현재 인텔 AI PC 및 데이터 센터 AI 제품 포트폴리오와 솔루션은 라마 3.1을 실행하며, OPEA는 인텔 가우디 2 및 제온 제품군에서 라마 3.1을 통해 완전히 활성화하고 있다. 인텔은 새로운 모델과 사용 사례를 지원하기 위해 지속적으로 소프트웨어 최적화를 진행하고 있다.

헬로티 서재창 기자 |

에이디링크, ‘AFM’ 기술로 산업용 엣지 시스템 유연성 강화

에이디링크가 산업 현장에 최적화된 차세대 엣지 AI 플랫폼을 통해 디지털 전환 가속화에 나서고 있다. 에이디링크는 신뢰성 높은 하드웨어와 임베디드 소프트웨어를 통합한 구조로 스마트하고 안정적인 시스템을 빠르게 구현할 수 있도록 지원한다. 신재생에너지·공장 자동화·지능형 교통 등 다양한 산업 분야에서 적용 가능하며 개발 기간 단축과 운영 효율성 향상을 동시에 실현할 수 있다. 에이디링크는 Intel, NVIDIA, Arm 등 글로벌 기술 기업들과 협력해 엣지 플랫폼의 성능과 확장성을 지속적으로 강화하고 있다. 이러한 협업을 통해 이기종 컴퓨팅 기반의 맞춤형 AI 솔루션을 제공하며 CPU·GPU·FPGA·ASIC을 통합한 구조로 복잡한 연산 작업을 효율적으로 처리할 수 있다. 고객은 애플리케이션 요구사항에 최적화된 시스템을 구성하면서도 투자 대비 효과를 극대화할 수 있다. 특히 에이디링크는 독자 기술인 ‘AFM(Adaptive Function Module)’을 도입해 시스템 통합의 유연성을 높였다. I/O 확장, AI 가속 모듈, SSD, 메모리, 무선 통신 등 다양한 하드웨어를 조합해 고객 맞춤형 구성이 가능하며 산업 현장의 요구 변화에도 신속하게 대응할 수

[인더스트리 솔루션 인사이트] 로봇이 된 공장, 소프트웨어가 된 산업

공장이 움직인다. 단순한 자동화를 넘어, 공장 전체가 하나의 거대한 로봇처럼 작동하는 ‘피지컬 AI(Physical AI)’ 시대가 도래했다. 이 가운데, 공장의 하드웨어 중심 운영은 소프트웨어 기반 플랫폼으로 전환되고 있으며, 이 과정에서 맥락을 이해하는 인공지능(AI), 디지털 트윈(Digital Twin), 시뮬레이션 등 기술이 핵심 역할을 한다. 현시점 제조업은 제품 생산을 이상의 가치를 추구하고 있으며, 시스템 자체를 수출하는 산업으로 진화하는 중이다. 이번 특집은 한국과학기술원(KAIST)의 ‘소프트웨어 정의 공장(SDF)’부터 네이버 ‘인공지능(AI) 에이전트’, 다임리서치 시뮬레이션 기술, 유니티 실시간 3차원(3D) 솔루션까지 제조업 혁신의 최전선 기술 방법론을 짚는다. [특집] 로봇이 된 공장, 소프트웨어가 된 산업 [Real-time 3D] 게임 넘어 산업 현장으로…실감나는 상호작용 경험이 ‘산업 DX’ 핵심 [AI Simulation] 제조·물류 현장 ‘물리적 AI’ 시대 도래…AI 시뮬레이션으로 미래를 현실로 [Physical AI] 공장이 하나의 거대한 로봇 된다…KAIST, 피지컬 AI로 제조 혁신 선언 [AI Agent] AI 에

애로우, AI·ML 기반 자동화 워크플로로 진단 정확도 향상하다

애로우 일렉트로닉스(이하 애로우)가 의료 영상 분야에서 인공지능(AI) 활용 방안을 담은 백서를 발표했다. 이번 백서는 MRI, CT, PET 등 대용량 의료 데이터를 기반으로 한 진단 과정에서 나타나는 다양한 과제를 짚고 이를 해결하기 위한 AI·머신러닝(ML) 기반 분석 기술과 고성능 컴퓨팅 인프라 전략을 제시한다. 의료 영상 데이터는 전 세계 의료 데이터의 30% 이상을 차지하며 2025년까지 지속적으로 증가할 것으로 예상된다. 기존 진단 방식은 방사선 전문의의 경험과 수동 해석에 크게 의존했지만 데이터 복잡성과 환자 증가로 인해 한계가 뚜렷하다. 특히 초기 병변은 신호가 약하거나 대비가 낮아 탐지가 어렵고 환자 간 해부학적 다양성이나 영상 기법 차이로 인해 오진 가능성도 크다. AI와 ML은 이러한 제약을 극복할 수 있는 도구로, 다중 모달리티 데이터를 분석해 미묘한 이상을 식별하고 종양 탐지·분류·치료 반응 예측 등 진단 효율성을 높인다. 백서에 따르면 AI 통합은 기존 방사선학 워크플로를 수동 중심에서 데이터 기반 자동화 파이프라인으로 전환한다. 이미지 수집 이후 GPU·AI 가속기를 활용한 병렬 처리와 NVMe SSD 기반 저장 장치, 고대역폭

경전기차(LEV)의 설계 혁신, 모듈형 파워트레인이 이끈다

지속가능한 미래 모빌리티의 핵심, 경전기차(LEV)의 성장세가 눈부시다. 글로벌 전기차 시장이 2024년 1조3280억 달러 규모에 도달하며, 이 중 LEV는 도심 통근 및 개인 이동 수단으로 빠르게 확산되고 있다. 이 전자책은 바로 이러한 흐름 속에서, 모듈형 파워트레인 설계를 중심으로 한 LEV 기술과 전략을 종합적으로 다루고 있다. 애로우 일렉트로닉스는 eBook을 통해 설계자와 제조사, 시스템 통합자들이 직면한 에너지 밀도 최적화, 열관리, 확장성, 규제 대응 등 핵심 과제를 제시하고, 이를 해결하기 위한 트랙션 인버터, HMI, ADAS, TPMS, 온보드 충전기 등 주요 하위 시스템별 설계 인사이트를 제공한다. 특히 Melexis, ST, Infineon, NXP, Analog Devices 등 주요 반도체·센서 업체들의 솔루션이 체계적으로 소개돼, 제품 선택에 실질적인 가이드가 된다. 주목할 점은, AI 기반 예측 유지보수, 디지털 트윈, 배터리 교체 기술 등 LEV의 미래까지 폭넓게 조망한다는 것이다. 단순한 부품 나열을 넘어, 확장 가능하고 유연한 모듈식 설계의 전략적 가치를 강조하며, 고속 충전·스마트 커넥티비티·자율주행 요소까지 아우르는

애로우, 고성능 LEV 인버터 설계로 모빌리티 전환 가속하다

애로우 일렉트로닉스(이하 애로우)가 소형 전기차(LEV: Light Electric Vehicle) 시장을 겨냥한 차세대 트랙션 인버터 참조 설계를 발표했다. 이번 백서는 전기 이륜차, 삼륜차, 마이크로 모빌리티 등 다양한 LEV 플랫폼에 빠르고 유연하게 적용 가능한 전력변환 솔루션을 제시하고 있다. 이번 참조 설계는 48V, 72V, 96V DC 전압 애플리케이션을 지원하며, 3kW에서 최대 15kW까지 전력 확장이 가능한 모듈형 구조로 설계됐다. NXP의 S32K3xx MCU와 Vishay의 하프브리지 MOSFET 기반 전력 모듈을 바탕으로 하드웨어와 임베디드 소프트웨어가 통합된 형태다. IEC61508 표준을 기반으로 한 기능 안전과 내장형 과전류 보호, 실시간 열 모니터링 등의 안정성 기능도 제공한다. 특히 고효율 전력변환을 위한 최적화된 PWM 제어, 최대 1000V 절연, 온도 센서 3개 지원, 회전식 리졸버 및 홀센서 기반 속도 피드백 기능 등 다양한 LEV 환경에 필요한 정밀 제어 기능이 포함됐다. 전원 보드는 최대 80V / 200A의 하프브리지 MOSFET을 통합해 낮은 온저항과 열저항 특성을 갖추고 있으며, 기생 인덕턴스를 최소화한 설계로

최신뉴스