배너
닫기
배너

[헬로AI] 세계가 인정한 LLM, 프라이빗 AI 향한 기치 올리다

URL복사
[선착순 마감 임박] AI분야 특급 전문가들과 함께 AI로 우리 기업의 미래 경쟁력을 확보하는 방법을 공유합니다. AI 비즈니스 개발 융합 컨퍼런스에서 확인하세요 (5/3, 코엑스3층 E홀)

[업스테이지 송원호 엔지니어 인터뷰]

AI 기술 경쟁력이 곧 국가 경쟁력인 시대다. 올해는 챗GPT를 필두로 한 생성형 AI의 등장으로, AI 기술 대중화가 시작됐다는 점에서 의미를 갖는다. 특히 생성형 AI 중에서도 거대언어모델이라 불리는 LLM이 주목 받았다. 오픈AI의 챗GPT, 구글의 바드, 메타의 라마 등 쟁쟁한 빅테크의 LLM이 시장을 강타한 가운데, 국내 스타트업이 독자적인 기술로 세계 AI 시장에 이름을 남겨 화제가 됐다. 바로, ‘Making AI beneficial’을 외치는 업스테이지의 이야기다. 



AI 대중화 위한 스테이지 만들다

 

LLM(Large Language Models)은 사람처럼 언어를 이해하고 생성하는 능력을 갖춘 AI 모델이다. LLM은 대규모의 텍스트 데이터를 활용한 학습을 통해 정제된 정보와 지식을 제공하고 있다. 그 역할은 마치 지식의 대중화를 이끄는 프로메테우스의 불과 같다.

 

기존 AI는 축적된 정보 안에서 사용자가 원하는 검색 조건에 대한 답을 내놨다면, LLM은 사용자의 물음에 대한 창의적인 답변을 선보인다. 이는 그동안 익숙했던 정보 탐색에 대한 개념을 새롭게 바꾸는 발견이었다. 업스테이지는 이 같은 기술을 대중과 함께 공유하는데 가치를 둔다. 

 

업스테이지는 AI 생태계의 선순환 구조를 만들고 누구나 AI 기술 혜택을 누리도록 지원하고 있다. 업스테이지의 대표 서비스로는 ‘아숙업(AskUp)’을 꼽는다. 아숙업은 오픈AI GPT-4를 기반으로 업스테이지의 OCR 기술을 결합해 만든 AI 챗봇 서비스다. 자연어 대화로 다양한 정보와 지식을 제공하며, 실시간 검색과 이미지 생성 기능이 추가됨에 따라 이용자 145만 명을 돌파하는 기록을 세웠다.

 

업스테이지 송원호 엔지니어는 “업스테이지는 AI의 대중화를 이끌고자 한다. AI는 불과 얼마 전까지만 해도 일반인이 접근하기 어려운 기술이었다. 우리는 모든 사람이 AI를 사용하도록 난이도를 낮추는데 집중하고 있다”고 밝혔다. 

 

업스테이지에서 LLM 관련 업무를 담당하는 송원호 엔지니어는 지난 상반기에 LLM 기술을 체이닝해 스스로 주어진 과제를 해결하는 범용 인공지능(AGI)를 개발하는 프로젝트를 진행했다. LLM 개발을 시작한지 한 달을 넘기지 않은 시점에 업스테이지는 챗GPT-3.5 성능을 뛰어넘는 놀라운 성과를 달성했다. 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’에서 챗GPT를 재치고 1위를 차지한 것이다. 허깅페이스 오픈 LLM 리더보드는 생성형 AI 모델 성능을 기준하는 바로미터다. 

 

허깅페이스 리더보드 기준으로, GPT-3.5의 벤치마크 평가를 뛰어넘은 사례는 업스테이지가 처음이었다. 이는 업스테이지 LLM 기술의 경쟁력을 대외적으로 알린 대표 사례로 남았다. 이에 송원호 엔지니어는 “GPT-3.5의 벤치마크 평가를 넘을 수 있었던 것은 업스테이지 내부에 AI에 진심인 사람들이 많았기 때문이다. 우리는 함께 AI를 논의하고 최신 연구를 내제화하는 과정을 통해 자체적인 AI 기술력을 길렀다"고 말했다. 

 

이어 그는 "업스테이지에는 이전부터 캐글을 통해 경쟁하는 문화가 있었다. 리더보드가 주어지고 그 안에서 경쟁하는 방식으로 모델링 작업을 수행한다. 팀원 간 서로 선의의 경쟁자 역할을 자처하다 보니 개발에 대한 경쟁심이 생기면서 실력을 만들어갈 수 있었다”고 소감을 밝혔다. 이 프로젝트를 기점으로, 업스테이지는 자체 LLM 개발에 본격적으로 나섰다. 

 

 

개인화와 한국어 LLM 고도화가 관건

 

챗GPT 등장 이후, 생성형 AI 도입을 원하는 기업이 늘어나는 추세다. 송원호 엔지니어는 챗GPT 전후로 일어난 변화에 대해 “기존 AI와 생성형 AI는 UX 관점에서 큰 차이를 보인다”고 말했다.

 

그는 “생성형 AI 역시 하나의 소프트웨어다. 기존 SW에는 정해진 기능이 있고, 사용자는 기능에 맞춰 SW를 사용했다. 사용자가 궁금한 내용을 포털 검색창에 입력하는 작업은 자연스러운 것이었다. 반면 생성형 AI은 사용자가 입력하는 작업을 사라지게 만들었다. 이 같은 변화는 앞으로 큰 차이를 만들 것이며, 이에 많은 기업이 실제로 생성형 AI 도입을 고려한다”고 덧붙였다. 

 

실제로, 업스테이지는 다양한 산업 영역에서 LLM과 관련한 협업 구조를 만들고 있다. 지난 9월, 업스테이지는 한국지능정보사회진흥원(NIA)과 한국어 AI 경쟁력 증진을 위한 LLM 리더보드 ‘Open Ko-LLM 리더보드’를 구축 및 개설했다.

 

이와 함께 업스테이지는 메타버스엔터테인먼트와 버추얼 아이돌 그룹 ‘메이브‘와 현실과 가상에서 대화를 나누는 자연어 기반 대화형 페르소나 AI 개발도 추진할 것을 밝혔다. 자체 LLM 모델 ‘SOLAR’를 활용해 페르소나 AI의 핵심인 엔진 개발을 맡기로 했다. 이뿐 아니라 업스테이지는 이커머스 기업인 커넥트웨이브와 생성형 AI 기반의 ‘프라이빗 LLM’ 구축 계약을 체결하기도 했다. 

 

한편, AI 업계에서는 개인화한 AI 개발에 방향성을 두는 모양새다. 이에 송원호 엔지니어는 “개인화한 AI에서 중요한 기술은 추천과 검색이다. 우리는 추천 엔진을 개발해왔으며, 검색 엔진도 보유했다. 검색 엔진과 추천 기술을 자체 LLM과 OCR에 엮어 초개인화 대화 모델을 개발할 수도 있다”고 말했다.

 

이어 그는 “개발된 모델은 영화 ‘아이언맨’에 등장하는 ‘자비스’와 같은 AI 비서 역할을 하게 될 것이다. 이는 결국 ‘모든 사람이 AI의 혜택을 누리게 될 것’이라는 업스테이지의 가치와 연결된다”고 강조했다. 이처럼 업스테이지는 자사 AI 모델 상용화로 본격적인 ‘프라이빗 AI’ 시장 개척에 나설 것이라고 밝혔다. 

 

프라이빗 AI는 기업 내부 데이터를 학습해 정보 유출과 관련한 보안 이슈를 막고 잘못된 정보를 생성하는 환각 현상을 방지하는데 특화한 솔루션으로 정평이 나 있다. 무엇보다 업스테이지는 빅테크의 거대 LLM보다 경량화한 모델 사이즈로 개선된 성능을 제공해 운용 비용에서도 강점이 있다. 

 

끝으로, 송원호 엔지니어는 자사 LLM 개발에 있어 한국어 학습을 강화할 것이라고 밝혔다. 그는 “허깅페이스에서 인정받았던 것은 영어 모델이었다. 하반기 동안, 영어 못지 않게 한국어 LLM을 고도화할 계획이다. 그러기 위해서는 데이터 퀄리티가 확보돼야 한다”고 강조했다.

 

이에 업스테이지는 한국어 데이터 부족을 해결하고 자사 AI의 강점을 극대화하기 위해 ‘1T 클럽’을 발족하기도 했다. 1T 클럽은 ‘1 Trillion 토큰 클럽’의 줄임말로, 책, 기사, 보고서 등 다양한 형태로 구성된 1억 단어 이상의 한국어 데이터를 기여하는 파트너사로 구성된다. 송원호 엔지니어는 “양질의 데이터는 비록 대량이 아닐지라도 고퀄리티 모델이 나올 수 있는 기초가 된다. 특히 프라이빗 LLM 시장에서는 한국어 모델을 찾는 기업이 많다. 머지 않아 완성될 한국어 LLM을 통해 시장에 긍정적인 영향을 끼지고차 한다”고 밝혔다. 

 

헬로티 서재창 기자 |










배너









주요파트너/추천기업