CCTV 사각지대에서 발생한 소리를 AI 통해 범죄 및 위급상황 감시 가능
한국광기술원은 공간광정보연구센터 김선만 박사팀이 CCTV 사각지대에서 발생한 소리를 인공지능(AI)을 통해 범죄 및 위급상황 감시가 가능한 ‘실시간 소리 객체 인식 기반 상황인지 솔루션’을 개발했다고 밝혔다.
이 기술은 기존의 특정 이벤트에 국한된 2~10여 개의 소리만을 인지하는 기술 수준을 벗어나, 복합적으로 섞여있는 모든 종류의 소리를 감지하는 것을 목표로 개발됐다.
비명, 신음, 화재경보, 발자국, 맹견, 문소리, 아이 울음, 성인 여자 울음, 기침, 한국어, 영어, 중국어 등 모두 76개의 소리를 인식한다. 소리신호 3초 내 복합적으로 포함된 소리 객체들을 91% 수준까지 정확하게 분류할 수 있다.
실제 환경에서 복합적으로 존재하는 소리 객체를 개별적으로 인식하고, 시간에 따른 소리 분포 정보를 기반으로 현장 상황에 대한 분석이 가능해 물리보안 관제 시스템에서 단독으로 혹은 영상정보와 함께 활용할 수 있는 장점이 있다.
연구팀은 소리를 기반으로 한 상황인지 기술이 사회 안전망 강화를 위한 보안 분야에 확대 적용될 수 있는 가능성을 열었다는 데 의의가 있다고 강조했다.
국내에는 2000년대 후반부터 본격적으로 설치 중인 CCTV는 현재 공공기관 기준 100만 대를 넘어섰으며, 일정 범위 내 CCTV 보호 인프라가 갖추어진 지역 대부분에서 관제 시스템을 운용하고 있다.
하지만 화장실 등 CCTV를 설치하기 힘든 곳이나 사각지대 등은 여전히 강력 범죄와 안전사고가 끊이지 않고 있다.
2016년 서울 강남역 살인사건, 2019년 부산 여고생 황화수소 질식사건 등은 CCTV 사각지대에서 일어난 대표적 사건이다.
청소년 사이에 유행한 기절 놀이 등은 CCTV에 찍혀도 범죄 위급상황으로 보기가 힘들어 영상만으로 범죄를 확인, 감시하는 데 한계가 있다고 연구팀은 지적했다.
이광훈 한국광기술원 공간광정보연구센터장은 "이번 개발은 4차산업혁명 시대 스마트시티 구현의 핵심 인프라인 통합관제센터의 기술 수준을 한 단계 끌어올렸다는 데 큰 의미가 있다"라며 "영상·소리 등 다중 정보를 활용하는 인공지능 기술개발에 박차를 가할 계획"이라고 말했다.
헬로티 김진희 기자 |