최신뉴스 ‘이미지를 텍스트로’ LG AI연구원, AWS 기반 AI 솔루션 출시
아마존웹서비스(이하 AWS)는 30일 AWS 리인벤트(re:Invent) 2023에서 LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원이 AWS 기반의 AI 이미지-투-텍스트(image-to-text) 캡셔닝 솔루션을 출시했다고 발표했다. 신규 캡션 솔루션은 3000억 개의 파라미터를 보유한 LG AI연구원의 멀티모달 파운데이션 모델(FM)인 엑사원(EXAONE)을 활용한다. 엑사원은 광고, 패션, 리테일 등 다양한 산업 분야의 전 세계 고객을 위해 보다 정확하고 관련성 높은 콘텐츠를 위한 캡셔닝 솔루션을 제공한다. 엑사원의 새로운 제로샷 이미지 캡션 솔루션은 생성형 AI를 사용해 인간의 인지 능력과 유사하게 이전의 경험과 지식, 훈련을 바탕으로, 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다. 이는 엑사원이 한국어와 영어로 된 이미지와 텍스트를 이해하고 인간에 가까운 추론 능력을 활용해 정확하고 상세한 이미지 캡션과 키워드를 작성할 수 있게 한다. 광고와 같은 산업군에서는 LG AI연구원의 기술을 활용해 제품 설명을 자동화하거나 광고·마케팅 캠페인을 위한 새로운 콘텐츠를 만들 수 있다. LG AI연구원은 엑사원의 학습 중 파라미터 수가 늘어나는