일상적인 작업부터 복잡한 QA 테스트까지 가능할 것으로 보여
H가 최초의 클라우드 기반 웹 에이전트인 '러너 H(Runner H)'를 출시한다고 발표했다.
H는 러너 H 0.1 베타 버전 출시를 통해 정체돼 있는 기존 확장 법칙의 한계를 넘어 초인공지능(artificial super intelligence, ASI)으로 나아가기 위한 도약의 발판을 마련했다. H를 이끌고 있는 찰스 칸토르(Charles Kantor) CEO는 “AI 에이전트 시장에 러너 H를 출시하게 돼 기쁘다”며 “러너 H는 사용자의 워크플로우를 자동화하고 작업을 간소화하며 웹을 소유하도록 하는 등 이전과는 전혀 다른 방식으로 AI를 활용할 수 있도록 지원한다”고 말했다.
AI 에이전트는 반복적인 수동 작업에 대한 접근 방식을 혁신하고 있다. H는 독자적인 파운데이션 및 실행 모델을 기반으로 추론, 계획 및 실행이 가능한 고급 에이전트를 제공한다. 이러한 에이전트는 사람의 제어 하에 복잡하고 여러 단계를 거치는 반복적인 워크플로우를 자동화하기에 기업과 개인 모두에게 필수적인 툴로서 역할하고 있다.
찰스 칸토르 CEO는 “러너 H는 단순한 생산성 툴 그 이상”이라며, 사용자가 창의성, 혁신 및 사람과의 의미 있는 관계에 집중할 수 있도록 일상적인 업무를 자동화하는 역량 강화 툴이라고 강조했다. 다양한 용도로 사용되도록 설계된 러너 H는 대기업의 다중 시스템 및 레거시 솔루션 환경에 원활히 통합되거나 신생 기업이 AI 에이전트로 구성된 팀을 활용할 수 있도록 지원한다. 이를 통해 일상적인 작업부터 복잡한 QA 테스트까지 인간과 기계의 협업을 위한 새로운 가능성을 제공할 것으로 기대된다.
러너 H는 다양한 시장에서 각 업계가 겪는 어려움을 해결하고 있다. 러너 H는 기업이 단 한 번의 프롬프트 입력만으로 전체 채용 프로세스를 자동화하도록 혁신하고 있다. 직무 설명 작성부터 이력서 취합, 지원자 맞춤형 후속 연락까지 불필요한 수작업을 없앨 뿐 아니라 링크드인 및 기타 플랫폼에서 얻은 인사이트를 바탕으로 지원자 데이터를 보강하고, CRM 자동 업데이트와 온보딩에도 적용할 수 있다. 기업은 러너 H를 통해 몇 주가 소요되던 업무를 단 몇 분으로 단축해 시간과 리소스를 절약하는 동시에 기업에 맞는 완벽한 지원자를 빠르게 찾을 수 있다.
러너 H는 많은 시간과 리소스 투입이 필요한 웹사이트 및 애플리케이션 테스트 과정에 획기적인 변화를 가져온다. 러너 H는 사용자 인터페이스의 변동사항에 매끄럽게 적응하고 반복적인 테스트 프로세스를 자동화할 뿐만 아니라 페이지 가용성 검증, 실사용자 행동 시뮬레이션, 결제 수단 간 호환성 보장 등 복잡한 워크플로우를 쉽게 탐색할 수 있도록 지원한다. 개발자는 테스트에 대한 유지관리 부담을 줄여 혁신과 창의성에 집중할 수 있으며, 핵심 영역에 초점을 맞춰 가치를 창출할 수 있다.
보험과 같이 많은 시간과 비용이 소요되는 비용 청구 워크플로우의 경우, 러너 H를 통해 보험 플랜 조회, 메모 작성, 비용 분석 및 제출, 환급 추적 등 가장 지루한 업무를 정밀하게 자동화함으로써 기업 워크플로우를 개선할 수 있다. 이 같은 프로세스 간소화를 통해 러너 H는 아웃소싱에 대한 의존과 지연을 줄이고 기업이 재무 운영을 제어하도록 지원한다.
에이전트 러너 H 0.1은 공개 벤치마크인 웹보이저에서 앤트로픽의 컴퓨터 유즈보다 29% 더 뛰어난 성능을 기록했다. 또한 러너 H에 기반한 H의 소형 모델인 2B 파라미터의 대규모언어모델(LLM) 및 비전언어모델(VLM)은 미스트랄과 메타의 대형 모델을 능가했다.
이 테스트는 작지만 집중적인 에이전트 모델이 범용 모델보다 합리적인 비용으로 뛰어난 성능을 발휘할 수 있음을 보여준다. 또한, H의 20억 개 매개변수 모델은 코드 및 함수 호출의 평균 성능이 높아 훨씬 큰 규모의 모델보다도 뛰어난 성능을 갖췄다. H-LLM은 H-VLM의 중추적인 역할을 하며, 텍스트 전용 H 에이전트로도 활용할 수 있다.
H는 그래픽 및 텍스트 요소를 인식 및 이해하고 상호 작용할 수 있도록 3B 매개변수 VLM을 훈련하고 전문화했다. H-VLM은 스크린스팟의 그래픽 사용자 인터페이스(GUI) 실행 기준 벤치마크 분석 결과, 오픈AI의 GPT4o, 앤트로픽의 소넷3.5, 미스트랄의 픽스트랄 라지, 메타의 라마 등의 성능을 뛰어넘으며 식별 부문에서 가장 강력한 소형 모델로 이름을 올렸다. 이처럼 H의 모델은 초대형 범용 모델 대비 정확하며 빠르게 합리적인 비용으로 사용할 수 있다.
러너 H는 현재 웹을 주력 환경으로 두고 웹 테스트와 프로세스 자동화, 아웃소싱과 같은 분야에서 가치를 즉각 제공하고 있으며, 모든 그래픽 인터페이스를 탐색할 수 있는 AI 에이전트로서 범용 자동화라는 궁극적인 비전을 구현하기 위해 나아가고 있다.
찰스 칸토르 CEO는 “오늘날의 대규모 언어 모델은 퍼즐의 한 조각에 불과하다”며 “H는 러너 H를 통해 현실에서 실행할 수 있는 AI의 새로운 시대를 열고 있다. AI 에이전트는 매력적인 기술일 뿐 아니라 인간과 기계의 인터페이스를 진정으로 혁신할 것”이라고 밝혔다.
H는 자연어 명령이나 시각적 데모로 확장 가능하고 제작에 즉시 적용 가능한 자동화를 위한 툴인 러너 H 0.1의 비공개 베타 버전을 공개했다. 이번 베타 버전에는 클라우드에서 실행되는 상용 및 관리형 에이전트를 호출하기 위한 API와 기존 및 실시간 작업을 검토하고 편집할 수 있는 H스튜디오가 포함됐다.
찰스 칸토르 CEO는 “러너 H는 시작에 불과하다”며, “웹을 시작으로 다른 환경으로 확장할 수 있는 러너 H를 발표하게 돼 기쁘다. 자동화의 미래는 무궁무진하며, 우리가 이 변화를 선도할 수 있어 자랑스럽다. 사람들이 러너 H와 같은 제품을 활용해 자동화를 실현하는 미래를 기대한다”고 전했다.
헬로티 서재창 기자 |