한국딥러닝이 국내 대형 금융사와 ‘비정형 여신 서류 AI OCR 자동화’ 프로젝트 계약을 체결하면서 시각지능 기반 DEEP OCR+ 솔루션을 적용한다. 이번 수주는 금융 업무에서의 비정형 문서 자동화를 본격화하는 사례로, 금융권 디지털 전환의 실질적 성과를 예고하고 있다. 대상 금융사는 기존에 여신 심사 과정에서 46종에 달하는 신청 및 증빙 서류를 하나의 PDF로 수령하고 수작업으로 분류 및 입력 작업을 했다. 이로 인해 문서 누락, 입력 오류, 병목 현상 등이 반복돼 왔다. 한국딥러닝은 이 문제를 해결하기 위해 자사 VLM 기반 AI 문서이해 솔루션 DEEP OCR+를 도입했다. DEEP OCR+는 이미지와 언어를 동시에 이해하는 VLM 기반 OCR 솔루션으로, 문서의 구조와 의미를 함께 분석해 핵심 정보를 자동 추출한다. 문서 병합 해제, 분류, 주요 항목 추출까지 전 과정이 자동화돼 검증 대시보드와 RPA 연계로 후속 업무까지 연동된다. 휴먼인더루프 검수 기능도 지원돼 실시간 오류 검증이 가능하다. 이번 프로젝트로 DEEP OCR+는 문서 구조 인식 정확도를 27% 향상시키고 평균 10배 빠른 병렬 처리로 실무 효율을 크게 개선한다. 오탈자 발생률은
헬로티 함수미 기자 | 한국전자통신연구원(ETRI)은 CCTV 영상에서 쓰러진 사람을 실시간으로 탐지하는 인공지능 기술을 개발했다고 밝혔다. 국내 연구진이 도심 안전사고 예방 및 신속 대응을 위해 시각 인공지능 ‘딥뷰(DeepView)’ 기술을 대전광역시에 본격 적용한다고 전했다. 이로써 도심 안전사고 예방 및 신속한 조치가 가능해 더욱 안전한 사회를 실현할 전망이다. 시각지능 딥뷰는 도심지역에서 주취자, 노숙자, 실신 등 쓰러진 사람을 실시간 탐지하는 행동 인식 AI 기술이다. 안전사고 예방 및 신속한 응급 구조조치 등에 활용 가능해 안전한 도시를 건설하기 위한 핵심 기술이 될 전망이다. 대부분의 기존 행동 인식 기술은 먼저 사람을 탐지하고 자세를 인식하는 2단계 구조로 이루어진다. 따라서 서 있는 사람에 비해 비정형 자세의 사람, 즉 웅크리거나 쓰러진 사람은 잘 탐지하지 못하는 등 미탐지가 많았다. 시각지능 딥뷰는 CCTV 영상 속 사람의 18가지 관절 포인트 및 6가지 자세 정보 등을 종합해 행동을 정확하게 인식한다. 연구진은 연관성이 높은 데이터를 동시에 이해하여 판단하는 최적의 딥러닝 모델을 개발해 비정형 자세 인식률을 획기적으로 개선했으며 탐지 시