배너
닫기

기획특집

왜 현실의 인공지능은 번번히 실패하는가?

URL복사
[선착순 마감 임박] AI분야 특급 전문가들과 함께 AI로 우리 기업의 미래 경쟁력을 확보하는 방법을 공유합니다. AI 융합 비즈니스 개발 컨퍼런스에서 확인하세요 (5/3, 코엑스3층 E홀)

 

개발 단계에서의 인공지능(AI)과 상용화 단계에서의 인공지능은 다르다.

 

개발 단계에서는 정형화 된 방대한 데이터를 기반으로 AI가 구축되기 때문에 원하는 결과값을 얻을 수 있다. 하지만 현실에서 이를 활용할 때는 얘기가 달라진다. 활용할 수 있는 데이터가 적고, 그 데이터마저 조잡한 저품질이 대부분이다.

 

벤처캐피탈 펀드인 'MMC Ventures'가 유럽의 AI 스타트업을 조사한 뒤 이 중 40%가 아예 AI 기술을 쓰지 않는다고 발표한 이유도 데이터에서 찾을 수 있다. 가트너의 애널리스트 스베툴라나 시쿨라(Svetlana Sicular)가 “2020년부터 AI 하강의 해가 본격적으로 시작됐다”라고 언급한 부분도 같은 맥락이다.

 

결국 품질 좋은 데이터, 많은 양의 데이터가 필요하다는 것인데, 이 역시 현실에서는 어려움이 있다. 많은 인력과 비용, 시간이 요구되기 때문이다. 그런 이유로 “실제 세계의 규칙성을 파악하기 위해서는 ‘적은 양의 조잡한 데이터’로 신경망을 학습시키기 위한 새로운 기계학습 이론이 만들어져야 한다”는 AI 전문가들의 의견이 설득력을 얻는다.

 

현업에서 느끼는 데이터의 목마름

 

그런데 정말 인공지능 현업에 있는 사람들은 데이터의 목마름을 느끼고 있을까?

 

지난해 ‘AI Tech 2021 : 인공지능 융합 비즈니스 개발 컨퍼런스’ 참가자를 대상으로 설문조사를 진행한 결과 “인공지능을 구현하는 데 어려운 부분이 무엇인가?”라는 질문에 60% 이상이 데이터라고 답했다.

 

문제는 데이터

 

AI를 상용화 하는 데 핵심은 ‘데이터’라는 말이다. 결국 모델 기반 AI(Model-Centric AI)보다 데이터 기반 AI(Data-Centric AI)가 더 실용적일 수 있다. 아래는 주민식 LG CNS 연구위원의 AI 분석 리포트에 나온 내용이다.

 

“2021년 3월 Andrew Ng가 제안한 방식은 이를 명확히 증명했다. 한 철강 제조업에서 개발한 불량품 탐지 AI 시스템을 테스트한 결과 76.2% 정확도를 보였으며, ‘모델 기반 AI’ 접근법으로는 정확도 90%를 넘길 수 없었다. 하지만 데이터 기반 AI 접근법으로는 정확도를 93.1%까지 끌어올릴 수 있었다.”

 

테스트웍스 윤석원 대표 또한 데이터의 중요성을 강조한다.

 

윤대표는 “AI 개발 관점에서의 데이터와 상용화 관점에서의 데이터는 다르다. AI를 고도화 하기 위해서는 처음 연구 개발 수준의 정형화된 데이터만으로는 안되며, 다양한 상황과 관점에서 접근한 새로운 데이터가 필요하다”고 언급했다. [IT조선이 2월 10일 개최한 ‘대한민국 인공지능 전망 2022 웨비나’에서]

 

서울대학교 조성준 교수는 “데이터 처리 이전에 기획부터 제대로 해야 한다”고 지적한다. 오픈 데이터셋 기반의 AI와는 달리 비즈니스에 적용하는 이른 바 ‘실질적인 AI’는 프라이빗 데이터가 필요하며 기업은 이를 구축하기 위해 기획부터 철저히 준비해야 한다.

 

빅데이터가 능사인가?

 

데이터 의존도는 더 많이 데이터량을 요구할 것이다. 이 흐름을 막기 위해서는 빅데이터가 아닌 다른 방법이 필요하다. 최근 인공지능 분야에서는 ‘작고 광범위한 데이터(Small and Wide Data)’를 활용하는 방법이 언급되고 있다.

 

 

가트너가 발표한 ‘인공지능에 대한 하이퍼사이클 2021’에서는 작고 광범위한 데이터의 중요성을 강조한다. 아래는 하이퍼사이클 내용의 일부다.

 

“데이터는 AI를 성공적으로 이끄는 핵심이며, 작고 광범위한 데이터는 인공지능 기반 분석 수준을 더 고도화 시켜준다. 무엇조직의 빅데이터 의존도를 낮춰줄 뿐만 아니라 상황 인식에 더 가깝게 도달시켜준다.

가트너에 따르면 2025년까지 조직의 70%가 빅데이터 의존 성향에서 작고 광범위한 데이터 성향으로 전환해야 한다고 강조한다. 이렇게 되면 데이터보다는 맥락 기반의 분석이 더 많아지게 되며, 데이터 부족 현상도 줄어들 것이다.”

 

주민식 연구위원은 “현실 세계에서는 정제된 데이터셋을 빅데이터 수준으로 제공받기 어렵다. 따라서 실제 세계의 규칙성을 파악하기 위해서는 ‘적은 양의 조잡한 데이터’로 광범위한 신경망을 학습시키기 위한 견고한 새로운 기계학습 이론을 만들어야 한다”고 지적한다.

 

[AI Tech 2022]의 주제도 ‘데이터’

 

올해 ‘AI Tech 2022 : 인공지능 융합 비즈니스 개발 컨퍼런스’에서는 이러한 데이터의 중요성과 한계에 초점을 맞춘다. AI Tech는 매년 국제인공지능대전(AI EXPO)과 함께 개최되는 AI 중심의 비즈니스 컨퍼런스다. 올해 ‘AI Tech 2022’는 4월 14일 코엑스에서 개최된다.

 

헬로티 조상록 기자 |










배너









주요파트너/추천기업