배너
닫기

테크노트

배너

[TECHNOLOGY FOCUS_다이내믹스와 기계학습 융합-①] 데이터 구동에 의한 인과관계 이해

  • 등록 2019.07.08 13:32:42
URL복사

[첨단 헬로티]


이 글에서는 필자가 최근 발전이 현저한 기계학습, 특히 심층학습 등으로 대표되는 데이터 구동형 연구 방법을 활용해 대응하고 있는 것, 발전을 기대하고 있는 것을 주제로, 제어·로봇 연구에 있어 이들 방법론의 방향에 대해서 다루기로 한다.


우선 문제의식을 공유하기 위해 필자의 배경을 잠깐 언급해 두려고 한다. 필자는 비선형 제어와 로보틱스를 전문으로 하고, 특히 이동 로봇의 설계와 제어에 관심을 가지고 있는 연구자이다.


보통 먼저 하는 것은 운동방정식을 세우는 것으로, 기계 링크계의 운동방정식에서 도출되는 비교적 저차원으로 비선형인 벡터장(ẋ=f(x))을 주된 상대로 하고 있었다. 즉, 정보량이 적은 단순 모델에서 거동을 이끌어내는 연역적인 연구 스타일을 주로 하고 있었다. 지배 법칙은 거의 완전히 알고 있기 때문에 실험을 하는 경우에도 겨우 소수의 파라미터를 동정하기만 하면 된다. 그 내용도 대체로 재현성이 높은 것이 많아, 실험은 이른바 이론의 데몬스트레이션으로 파악하고 있었기 때문에 현상 그 자체나 데이터에 대한 의식은 희박했다고 자백한다.


그러나 이동 로봇의 연구를 계속하는 가운데, 로봇 본체보다 그 ‘환경’ 쪽으로 관심이 향하는 경우가 많았다. 계기의 하나는 이동 로봇의 무대를 평탄한 바닥 위에서 공중, 물 위, 그리고 모래 위로 전개하기 시작한 것이다. 이동 로봇이 자신의 위치를 바꾸기 위한 구동력은 환경의 반력에 의해 얻어지는 것이다. 바닥 위의 운동이라면 그것은 바닥 반력이나 바퀴의 횡구속력으로서 명확하게 정식화할 수 있지만, 환경 자체가 비정상의 유동성을 갖게 되는 순간 파악하기 어려워진다.


두 번째는 건설기계 분야의 산학 연계 연구의 기회를 얻어, 극단적으로 불균일한 지면에서 활동하는 작업기계의 연구에 착수했다. 작업기계 자체는 기계 링크계에 지나지 않기 때문에 기존의 로보틱스 방법론으로 충분히 처리할 수 있다고 당초에는 생각했지만, 실제로는 기계를 둘러싼 토사의 거동 쪽이 문제의 본질이라는 것을 머지않아 알게 됐다.


세 번째는 이동 로봇의 궁극적인 샘플인 생물 로코모션의 해명으로 연구 테마가 확산되었고, 토사 등의 불균일한 지면에서 활동하는 생물의 압도적인 복원력, 그리고 실제 생물을 대상으로 하는 연구의 어려움과 재미에 매료된 것이다.


이러한 경험을 통해 오랫동안 멀어져 있던 ‘우선 현상을 자세히 관찰한다’는 귀납적인 스타일로 되돌아오게 됐다. 동시에 최근 기계학습 분야의 발전을 눈앞에서 직접 보고, 그것을 효과적으로 활용하는데 있어 ‘현상이란 무엇인가, 데이터란 무엇인가, 가설이란 무엇인가’ 하는 과학 철학의 기본에 새삼 마주할 수밖에 없게 됐다.


필자는 물론 기계학습에 대해서도 과학 철학에 대해서도 전문가는 아니며, 일개 연구자에 지나지 않는 입장에서 지식을 피력하는 것이 부끄러울 따름이다. 다만 필자와 같이 연역적인 스타일을 중심으로 연구해 온 배경을 갖고 있으며, 앞으로 기계학습 방법론을 제어공학 연구에 어떻게 도입할지, 정말로 가능한 것은 무엇인지를 생각하고 계신 독자 여러분에게 도움이 되길 바란다.


이해와 설계의 사이클


먼저 우리가 연구자로서 무엇을 이루고 싶은가 하는 것을 그림 1에 나타낸 ‘이해’와 ‘설계’의 사이클로 파악하는 데서 시작한다. 이하, 한정된 지면 때문에 때때로 간략하게 단정 짖는 표현으로 말하는 것을 양해해 주기 바란다.



우리 공학자의 대부분은 자연현상을 이해하고, 또한 그것을 활용해 유익한 인공물이나 시스템을 창출하고 싶다고 생각하고 있다. 전자는 알고 싶다는 과학적인 동기이며, 후자는 만들고 싶다는 공학적인 동기이다. 축의 무게에 차이는 있지만, 어느 쪽인가 끝나지 않는 것이 공학의 영위일 것이다.


어떤 현상을 잘 이해했다면 그것을 무언가의 설계에 활용할 수 없을까(알았으니 만들고 싶다)라고 생각하는 것이 보통이며, 잘 움직이는 인공물을 설계하기 위해서는 그 원리를 잘 이해하고 싶다(만들기 위해 알고 싶다)고 생각한다. 또한, 이미 설계되어 움직이고 있는 것에 대해서도 그것은 정말 잘 움직이고 있는지, 왜 잘 움직이고 있는지, 다음에 동일한 것을 설계하기 위해서는 어떻게 하면 좋은지 생각한다(만들어진 것을 알고 싶다). 이렇게 이해와 설계를 희구하는 공학의 사이클은 계속되어 간다.


그러면 이하에서는 이 ‘이해’와 ‘설계’의 과정에서 중요한 것, 그중에서 데이터 구동형 연구 방법을 어떻게 활용할 수 있을지에 대해 고찰한다.


1. 데이터 구동 방법에 의한 이해


그림 1 왼쪽의 ‘이해’는 자연 속에서 일어나고 있는 것을 ‘현상·법칙·원리’의 3단계를 거쳐 지성으로 불러들이는 과정을 보이고 있다. 즉,


(1) 관측에 의한 현상의 기록 (데이터화) 

(2) 귀납에 의한 법칙의 추출 

(3) 추론에 의한 원리의 구축


이다. 고전 역학의 예에서 말하면, (1)은 튀코 브라헤에 의한 행성운동 관측, (2)는 케플러에 의한 운동 법칙(및 갈릴레이에 의한 지상의 낙하운동 법칙), (3)은 뉴턴에 의한 만유인력 원리의 구축에 해당한다.


오늘날의 데이터 구동형 방법의 발전은 이 ‘이해’의 프로세스를 진행시키는데 강력한 도구를 제공하고 있다. 이것은 측정 기술의 발전과 센서의 저가격화에 의해 대량의 관측 데이터를 쉽게 얻을 수 있게 된 것, (2)의 과정을 가속하는 기계학습, 데이터 마이닝 등의 방법론과 그것을 지지하는 병렬 계산 기술에 의한 혜택이 크다. 예를 들면 DeepMind의 AlphaFold에서는 유전자 배열에서 생성되는 단백질의 3차원 구조 예측이라고 하는, 예전에는 그 자체가 과학적 연구가 될 수 있었던 문제가 자동화 가능해진 것이 보고되어 있다. 필자 등이 심층 뉴럴 네트워크(DNN)을 ‘간편한 피팅 툴’로서 활용하는 정도라도 그 유용성과 범용성은 충분히 느낄 수 있다.


이와 같이 수단이 진화하면 할수록 그것을 이용하는 연구자의 역할이 부각되는 것도 흥미 깊은 부분이다. (2)의 과정에서 기지의 입출력 데이터로부터 인과관계를 모델화해 미지의 입력에 대한 출력을 예측하는 탁월한 도구를 손에 넣었다고 하면, 남은 것은 (1)과 (3)의 과정이다. 전자는 ‘사실상 무한의 정보량을 가진 자연현상에서 어떻게 유한의 정보를 꺼내는가’, 후자는 ‘어떠한 원리=가설을 구축하는가’ 하는 주체적인 문제를 포함하고 있다. 모두 우리가 대상을 ‘이해’하기 위한 행위이며, 주체 없이는 자동화하는 것은 본질적으로 불가능하다.


그리고 이 과정이야말로 과학적 사고 그 자체라고도 할 수 있다. 이것은 기계학습 분야에서도 항상 의식되고 논의되고 있는 ‘연구 대상 그 자체에 대한 깊은 이해(도메인 지식)의 중요성’, ‘과학습의 억제(모델의 저차원화)’의 문제와 그대로 부합한다. 이 점에 대해서 필자 등이 직면해 실감한 사례를 아래에 소개한다.


2. 이해와 설계를 위한 모델 저차원화


나니와 등은 고령자의 재활 지원을 목적으로 사람이 앉은 자세에서 일어서는 동작을 해석했다. 모션 캡처 시스템에 의해 다차원적이고 대량의 관측 데이터 (1) 및 그 변화의 법칙 (2)까지는 쉽게 얻을 수 있다.


나니와 등은 여기에서 신체 각 부위의 운동 정보 그 자체는 너무 다차원이고, 에너지나 파워 등의 스칼라량 변화의 법칙은 너무 저차원인 것을 지적, 2~3차원의 양인 운동량 벡터의 변화에 ​​주목하는 것을 제안했다. 이에 의해 일어서는 운동의 메커니즘을 잘 파악할 수 있고, 개호 로봇의 설계 혹은 개호인 지원 등의 목적으로 이어질 수 있는 가능성을 발견했다.


또한, 대상은 전혀 다르지만 필자 등은 모래 위를 고속 주행하는 달랑게류(그림 2)의 운동 데이터를 대량으로 축적했는데, 그 운동 메커니즘을 이해하기 위해 나니와 등의 개념을 응용해 최종적으로는 게를 본뜬 다각 고속 주행 로봇의 설계에 활용하는 것을 목적으로 했다.



모델을 구축하는 것은 원리의 이해에 종종 유용한데, 모델이 구축됐다고 해도 그대로 이해로 이어지는 것은 아니다. 예를 들면 물리 계산 엔진과 기상 시뮬레이터, 엔진 모델 등의 대규모 물리 모델은 개별 요소의 거동은 확고한 물리적 지식에 근거하는 제1 원칙에 의해 규정되어 있지만, 조직된 전체의 시스템은 너무 복잡해 그 동작은 시뮬레이션을 해 보지 않으면 알 수 없다. 견해에 따라서는 ‘실험장치가 하나 늘었다’는 정도에 지나지 않는 경우도 자주 일어난다.


이 글 처음 부분에서 말했듯이 필자 등은 모래 위·모래 속의 머니퓰레이션인 굴삭기 설계나 모래 위 로코모션인 산호뱀 로봇의 연구(그림 3), 공중 수영 로봇의 연구 등을 통해, 로봇의 설계·제어를 위한 환경 모델의 이해라는 문제에 직면했다. 앞에서 말한 모두 로봇 자체는 강체 링크계이며, 그 운동 해석은 고전적인 로보틱스의 범주이다.



한편, 로봇을 둘러싼 모래입자와 공기의 동작에 대해서는 이것도 최근 발전이 현저한 이산요소법(DEM)과 수치유체역학(CFD) 기술에 의해, 현재는 아직 실시간에는 거리가 좀 멀지만 상세한 시뮬레이션이 가능해졌다. 그러나 설계자가 진정으로 필요로 하고 있는 것은 로봇의 설계와 제어를 위한 정보, 예를 들면 지느러미나 링크 운동에 대한 환경의 거동과 그 리액션으로 시뮬레이션 결과를 설계 모델에 환원하기에는 아직 격차가 있다고 할 수 있다.


단, 앞에서 말했듯이 대규모의 제1 원리 시뮬레이터가 실험장치의 하나라고 간주할 수 있는 것을 활용하면, 이것에 대해 데이터 구동 방법을 이용해 접근하는 것이 충분히 가능하다. 예를 들면 시뮬레이터에 대해 DNN 등의 회귀 방법을 이용해 저차원의 인과관계 모델에 환원한다, 혹은 예측 모델을 구축하는 등의 시도는 현대만의 과학적인 방법이라고 해도 좋을 것이다.


이와 같이 데이터를 기초로 ‘원리=가설’을 구축하고 그 후의 설계에 활용하기 위해서는 항상 목적에 따른 모델의 저차원화, 이른바 적당한 차원(moderate degrees-of-freedom)에서 인과관계를 파악하는 것이 중요하다. 그 목표를 결정하는 것은 과학적 고찰·공학적 설계의 주체인 우리 연구자 자신이다. 자동화할 수 있는 프로세스를 강력하게 지원함으로써 연구자가 주체적으로 고찰해야 할 각각의 문제에 전념할 수 있게 되기를 기대하고 있다.


인식과 행동의 사이클


그런데 그림 1에서는 자연적으로 대치하는 지성으로서, 과학적 이해 및 공학적 설계에 임하는 우리 연구자 자신을 가정하고 있었다. 이른바 오프라인의 이해와 설계의 사이클을 논하는 그림이었다. 로보틱스에 종사하는 연구자로서는 더 나아가 이러한 지성을 가진 자율적 기계, 즉 실시간으로 자연을 ‘이해’하고 자기 자신의 행동을 ‘설계’하는 지능 로봇을 실현하고 싶거나, 혹은 그러한 지성을 이미 실현하고 있는 생물을 이해하고 싶다고 생각한다. 이것을 ‘인식’과 ‘행동’의 사이클로서 다시 파악한 그림을 그림 4에 나타냈다.


그림 1과 그림 4의 큰 차이는 지능 로봇(혹은 생물)은 인식과 행동을 실시간으로 해야 한다는 점이다. 지각에 걸리는 리소스도 판단에 걸리는 리소스(시간과 계산 능력)도 시행착오가 허용되는 기회도 극단적으로 한정되어 있다. 이하에서는 이 점에 대한 기계학습의 기대와 역할에 대해 설명한다.



1. 지능 로봇에 의한 인식과 행동


학습적 방법에 의한 지능 기계의 행동 결정의 연구에는 오랜 역사가 있다. 특히 Q학습을 비롯한 강화학습의 모든 방법은 1990년대부터 활발하게 적용이 시도되어 왔는데, 최근에는 심층학습 방법론과 결합함으로써 그 잠재력이 단번에 향상됐다. 가치함수를 DNN으로 실장한 심층 Q학습이 그 주인공인 것은 말할 필요도 없다. 항간에서도 주목받은 Ponanza와 AlphaGo 등의 게임 AI의 예에서 볼 수 있듯이, 기호화된 상황 하의 행동 결정에서는 이미 뛰어난 성능을 보여주고 있다.


한편, 상황을 한정하지 않는 실제 세계의 행동 결정은 여전히 어려운 과제이며, 인간에게 있어 매우 용이한 일상적인 작업을 감당할 수 없는 경우도 많다. 이 갭의 요인은 하나는 하드웨어 그 기술 자체의 어려움, 즉 환경과의 물리적 상호작용을 수반하는 작업의 실현, 소프트웨어 기술의 놀라운 발전 속도에 비하면, 아직 미발전 단계이기 때문일 것이다. 아리모토는 이것을 일상 물리학(everyday phisics)의 과제라고 부르고 있다. 이 점에서 모션 컨트롤을 중심으로 한 제어공학의 역할은 크지만, 발휘되는 성능이 코스트만큼의 가치가 있는지의 여부에 대한 과제는 최후까지 남아있을 것으로 생각된다.


더구나 보다 근본적인 문제를 찾다 보면, 실제 세계의 상황 인식과 추론이 본질적으로 안고 있는 문제, 이른바 프레임 문제에 이르게 된다. 프레임 문제는 McCarthy와 Hayes에 의해 지적된 인공지능의 한계에 대한 고전적 고찰로, 나중에 일반화 프레임 문제로서 인공지능뿐만 아니라 인간이나 생물의 지능을 언급하는 문제로 확장된다.


Dennett에 의한 폭탄 해제 로봇의 예시로 잘 알려져 있듯이 유한 처리 능력만 가지고 있는 지능이 무한정의 상황에 놓였을 때에 부작용으로서 발생할 수 있는 모든 현상을 고려하면 행동을 결정할 수 없거나, 혹은 목적을 한정하기 위해 사고의 틀(프레임)을 정하려 해도 그 자체에 무한의 처리 능력을 필요로 한다는 문제이다. 간단한 작업이라도 로봇이 현실 세계에서 직면하는 정보량은 거의 무한하고, 거기서 일어날 수 있는 가능성을 열거하거나, 추론에 불필요한 정보를 배제하는 것은 사실상 불가능해진다.


2. 강화학습에 의한 인식과 행동의 직결 


그러면 이러한 프레임 문제에 빠지지 않고 실제 환경의 행동을 결정하려면, 프레임 문제를 정면으로 상대하는 대신에 ‘의사 해결’을 해야 한다. 로봇에 있어 필요한 것은 지금 취해야 할 행동을 결정하는 것으로, 자연을 정확히 인식하고 이해하는 것은 필수가 아니다. 이와 같은 방침에 근거하는 것으로서 그림 4의 ‘지성’을 경유하지 않고 인식과 행동을 직결하는 이른바 포섭 아키텍처(subsumption architecture)나, 행동 결정을 위해 필요한 정보를 가설하는 ‘간주 정보’ 등의 개념이 제창되고 있다. 


기계학습의 발전에 의해 가속화된 강화학습의 방법론은 내부 표상을 개입시키지 않고 지각과 행동을 직결하는 실현과는 상성이 좋다. 특히 압도적 많은 수의 멀티모달한 센서를 전신에 분포시키는 ‘리치센서’ 로봇의 개념은 심층 강화학습과의 조합 하에서 진가를 발휘할 것이다. 필자 등도 오오스가 등이 제안한 다모 접촉 센서에 심층 강화학습을 적용해 촉각에 근거한 행동 결정 실현을 시도하고 있으며, 그 외에도 비자명한 이동 로봇의 행동 패턴 획득(그림 5) 등을 하고 있다.



단, 이 경우는 로봇이 행동 결정의 과정에서 무엇을 인식하고 어떻게 추론했는지에 대해서는 어떤 단서도 얻을 수 없다. 추론 과정의 설명 가능성이나 성능 보증의 중요성도 또한 심층학습 분야에서 자주 지적되고 있는 것으로, 앞으로 더욱 발전이 기대된다.


3. 무능 로봇에 의한 도전


마지막으로 포섭 아키텍처의 실현과 관련이 깊은 것으로서 필자 등이 하고 있는 무능 로봇에 의한 접근에 대해서 설명한다. 그림 6에 나타낸 4족 보행기계는 DC 모터와 슬라이더=크랭크 기구로 구성된 다리 유닛을 4개 연결한 것이다.


센서도 컨트롤러도 탑재되어 있지 않으므로 공중에 매달린 상태로 각 모터에 정전압을 인가하면, 각 다리 각각 별도의 위상에서 주기운동을 한다. 그러나 이것을 바닥면에 놓은 상태로 정전압을 인가하면, 바닥면과의 역학적 상호작용을 매개로 다리 간의 협조에 의해 각 다리의 위상이 일정한 패턴이 되어 walk에 대응하는 보행이 발현된다. 더구나 인가 전압을 증가시키면, 좌우 다리의 위상이 동기한 gallop 보행으로 분기하는 흥미 깊은 현상을 볼 수 있다.



그림 7은 동일한 DC 모터와 슬라이더=크랭크 기구에 의해 연결된 바퀴형 뱀 로봇이다. 각 링크는 체간 방향으로만 굴러갈 수 있는 수동 바퀴를 갖추고 있으며, 한쪽 끝의 링크만 바퀴가 붙어 있지 않다. 이 경우도 역시 정전압을 인가하는 것만으로 인접 링크 사이에 일정한 위상차가 발생, 바퀴 없는 링크를 선두로 한 추진 패턴이 발현된다. 수직 호핑 로봇에 탑재한 경우도 동일하게 정전압을 인가하는 것만으로 일정한 주기 도약 패턴이 되는 것, 인가 전압을 증가시키면 이중 도약과 같은 패턴으로 분기하는 것이 나타났다.


이러한 예에서는 모두 명시적으로 프로그램된 제어칙을 가지고 있지 않다. 그 의미에서는 동적 수동 보행과 동일하게 자율적인 물리현상에 지나지 않지만, 다리 끝이나 바퀴에 걸리는 외력을 갖추어 안정된 주기 패턴을 생성하는 제어칙을 기구적으로 실현하고 있다고 보면, 거기에 내재하는 패턴 안정화 메커니즘, 분기 메커니즘에 대한 의문이 생기게 된다. 이에 대해 필자 등은 단순화된 수리 모델에 근거한 연역적인 의논에 의해 어느 정도의 해명은 하고 있지만, 실험 데이터에 근거한 귀납적인 해석은 아직 충분하지 않다. ‘이미 동작하고 있는 인공물’인 무능 로봇이 왜, 어떻게 이 기능을 실현하고 있는지, 데이터와 기계학습을 원용한 해명이 가능하기를 바란다.


맺음말


이 글에서는 필자 나름의 데이터 및 데이터 구동형 연구 방법을 마주하는 법에 대해 설명해 왔다. 이 글의 논제는 물론 답이 1개로 정해지는 성질의 것이 아니라, 연구자가 각각의 철학을 가지고 있을 것으로 생각한다. 독자 여러분의 의견, 질타를 받아들여 오픈된 의논의 계기가 된다면 좋겠다고 생각한다.


石川 将人, 오사카대학



















주요파트너/추천기업