
한국전자통신연구원(ETRI)이 ‘AI 반도체 소프트웨어 플랫폼’의 최신 기술을 공유하고, 차세대 인재를 발굴하기 위한 설계 경진대회를 개최했다.
ETRI가 개발한 ‘모듈형 엣지 AI 반도체 플랫폼 기술’은 RISC-V 기반 개방형 아키텍처와 자체 개발된 MLIR 기반 컴파일러 기술을 결합한 하드웨어와 소프트웨어의 통합설계 기술이다. 이는 기존 상용 기술 대비 접근성과 확장성이 탁월한 오픈소스 기반 설계 방식이다. 국내 엣지 AI 반도체 생태계 활성화에 기여할 수 있는 기술적 가치가 매우 높은 것으로 평가되고 있다.
특히 기존 SoC 대비 연산기, 메모리, DMA 등을 모듈화하여 성능 수준과 응용 목적에 맞도록 조합할 수 있는 구조이기 때문에, 다양한 엣지 AI 환경과 NPU 제약에 유연하게 대처할 수 있다. 따라서 새로운 NPU가 추가되더라도 백엔드 모듈만 교체하면 적용할 수 있어서 특정 하드웨어에 종속되지 않고, 유지 보수성과 구조 확장성이 뛰어나고, 공개 저장소와 연계한 오픈소스 생태계 확장에도 유리하다.
또한 고급 경량화를 포함하는 컴파일러 기반 최적화 기술이 포함돼 기존 상용 툴체인 대비 더 높은 성능과 정밀도 조절 유연성을 가진다.
한편, 이러한 기술의 활용 가능성은 지난 6월에 있었던 ETRI 컨퍼런스를 통해 실증 사례로도 소개됐다. 연구진은 외부 통신 없이 온디바이스 AI만으로 복잡한 보행로 상황을 설명하는 가이드독 로봇을 선보이며, 모듈형 엣지 AI 반도체 플랫폼의 실효성과 확장성을 입증해 보였다.
시각장애인을 보조하는 안내 로봇이라는 실제 응용 사례를 통해, 고성능 AI 연산이 제한된 엣지 환경에서도 안정적이고 신뢰도 높은 서비스가 가능하다는 점을 강조했다.
이번 기술의 개발 현황 공유와 차세대 인재 발굴을 위해 ETRI는 2025년도 반도체공학회 하계종합학술대회에서 AI반도체 SW플랫폼 워크샵 및 설계 경진대회를 개최해 미래 발전방향을 모색하는 시간을 가졌다.
이번 워크숍에서는 AI 반도체 소프트웨어 플랫폼과 관련된 최신 기술 동향과 연구 성과가 공유됐다. 먼저, ‘Beyond Silicon: NPU를 위한 소프트웨어 생태계’ 발표에서는 AI 반도체가 실제 산업에 적용되기 위해서 소프트웨어 생태계, 특히 오픈소스 기반의 개발 환경이 중요하다는 점이 강조됐다.
국산 NPU를 위한 오픈소스 기반 대규모 언어모델(LLM) 서빙 라이브러리 개발 사례도 함께 소개돼 눈길을 끌었다. 이어 ‘이기종 시스템에서의 DNN 스케줄링 최적화’ 발표에서는 CPU, GPU 등 다양한 연산 장치가 혼합된 시스템에서 딥러닝 모델의 실행 속도를 높이기 위한 스케줄링 기법이 발표됐다. 모델 구조와 연산 자원의 특성을 고려해 병렬 처리 효율을 높이는 전략이 소개됐다.
리벨리온의 ‘PyTorch 기술 개발 방향’ 발표에서는 PyTorch 프레임워크를 기반으로 한 그래프 모드 및 즉시 실행 모드(eager mode) 개발 현황과, AI 연산 최적화를 위한 Triton 커널 작성 기술, 고속 LLM 실행을 위한 vLLM 지원 기술 등이 소개됐다.
마지막으로 ‘경량화된 LLM의 성능 평가’ 발표에서는 최신 거대 언어모델에 경량화 기법을 적용한 사례와 함께, 성능 저하 원인 및 실무 적용 시 고려사항이 설명됐다. 특히 모델 크기나 과제 난이도에 따라 성능 변화가 어떻게 나타나는지에 대한 분석을 통해 경량화 모델 활용 시 주의할 점이 제시됐다.
이와 함께 대학생·대학원생을 대상으로 한 ‘ARX/RVX 기반 AI 반도체 설계 경진대회’도 성황리에 진행됐다. 해당 플랫폼은 RISC-V 기반 칩에 AI 연산 가속기(ARX)를 결합한 설계 환경으로, 중소기업 및 스타트업, 대학에서도 쉽게 활용할 수 있는 기술로 평가받고 있다.
정영준 ETRI 온디바이스AI연구본부장은 “해외 상용 기술에 의존하던 핵심 기술 영역을 국산화함으로써 기술 수입 의존 구조를 개선하고 중소 기업의 시장 진입 기회를 확대시켜, AI 반도체 생태계와 고급 인력 양성의 기반이 되기를 기대한다”고 밝혔다.
헬로티 이창현 기자 |