아마존웹서비스(이하 AWS)는 AWS 리인벤트 행사에서 새로운 데이터 관리 서비스인 '아마존 데이터존'을 발표했다고 5일 밝혔다.
이를 통해 고객은 AWS, 온프레미스, 서드파티 소스에 저장된 데이터를 더 빠르고 쉽게 분류, 검색, 공유, 관리할 수 있다.
아마존 데이터존을 사용하면 조직의 데이터 자산을 감독하는 관리자와 데이터 담당자가 세분화된 제어를 사용하여 데이터에 대한 액세스를 관리하고 제어하여 적절한 수준의 권한 및 올바른 컨텍스트 상에서 데이터에 대한 접근이 이루어지도록 한다.
엔지니어, 데이터 사이언티스트, 제품 관리자, 분석가, 비즈니스 사용자는 아마존 데이터존을 통해 조직 전체의 데이터에 쉽게 액세스하여 데이터를 검색, 사용하고 협업을 통해 인사이트를 도출할 수 있다.
아마존 데이터존은 데이터 생산자가 데이터에 대한 접근성을 보다 쉽게 관리, 제어하고 데이터 소비자가 데이터를 검색, 사용 및 협업하여 비즈니스 인사이트를 도출할 수 있도록 하는 새로운 데이터 관리 서비스다.
데이터 생산자는 아마존 데이터존의 웹 포털을 사용하여 데이터 분류 체계를 정의하고 거버넌스 정책을 구성하며 다양한 AWS 서비스(예: 아마존 S3, 아마존 레드시프트), 파트너 솔루션(예: 세일즈포스, 서비스나우)과 온프레미스 시스템에 연결함으로써 자체 비즈니스 데이터 카탈로그를 설정한다.
아마존 데이터존은 머신 러닝을 사용하여 각 데이터 세트에 대한 메타데이터를 수집, 제안하고 고객의 분류 체계 및 선호도에 대한 트레이닝을 통해 점진적으로 개선함으로써 카탈로그를 유지 관리하는 번거로움을 덜어준다.
카탈로그가 설정되면 데이터 소비자는 아마존 데이터존 웹 포털을 사용하여 데이터 자산을 검색 및 발견하고, 컨텍스트에 대한 메타데이터를 검사하며, 데이터 세트에 대한 접근을 요청할 수 있다.
데이터 소비자가 데이터 분석을 시작할 준비가 되면 사용자가 다양한 데이터 세트를 가져오고, 동료와 액세스를 공유하며, 분석을 위해 협업할 수 있는 웹 포털의 공유 공간인 '아마존 데이터존 데이터 프로젝트'를
생성한다.
아마존 데이터존은 아마존 레드시프트, 아마존 아테나, 아마존 퀵사이트와같은 AWS 분석 서비스와 통합되어 데이터 소비자가 데이터 프로젝트의 컨텍스트에서 서비스에 접근할 수 있도록 하므로, 별도의 로그인
자격 증명을 관리할 필요 없이 데이터를 이러한 서비스에서 자동으로 사용할 수 있다.
또한 아마존 데이터존은 데이터브릭스, 스노우플레이크, 태블로와 같은 파트너 또는 사용자 지정 솔루션과 통합할 수 있는 API(애플리케이션 프로그래밍 인터페이스)를 제공하므로 고객은 모든 데이터 자산을 쉽게 게시, 검색 및 사용할 수 있다.
스와미 시바수브라마니안 AWS 데이터베이스, 분석, 머신러닝 부문 부사장은 "아마존 데이터존을 통해 고객은 강력한 거버넌스 제어와 간소화된 액세스의 균형을 유지하는 단일 서비스를 사용해 데이터를 쉽게 찾고 구성하며 협업할 수 있다"며 "아마존 데이터존은 조직 전체가 자유롭게 데이터에 액세스할 수 있게 해주므로, 모든 직원이 가치를 극대화할 수 있는 새로운 인사이트를 얻을 수 있다"고 말했다.
헬로티 이창현 기자 |