기업 시스템 신뢰도 높이고 싶다면, 고려해야 할 것

* 이 기사는 바이라인플러스 웨비나 ‘모니터링’을 넘어 ‘옵저버빌리티’로의 진화에 기반해 작성되었습니다.

구글에 따르면, 0.5초의 응답 지연이 있을 때마다 서치 트래픽이 20% 감소한다. 글로벌 콘텐츠전송네트워크(CDN) 기업 아카마이에 따르면, 100밀리세컨즈의 지연이 있을 때마다 고객 전환율이 약 7% 떨어진다. 소비자 리포트 기업 익스퍼리언에 따르면, 기업의 보안사고는 해당 기업의 평판을 약 17~31%로 떨어트리는 것으로 나타났다.

결국 시스템 신뢰도가 기업의 생존에 영향을 미친다는 이야기다. 기업은 시스템의 신뢰도를 높이기 위해 전체 시스템에 대한 가시성을 확보해야 한다. 최근 단순 모니터링이 아니라, 이보다 진화한 개념인 ‘옵저버빌리티’가 주목받는 이유다. 옵저버빌리티는 지표, 이벤트, 로그, 추적의 원시 데이터를 가져와 시스템 성능과 문제가 발생할 수 있는 지점을 실시간으로 파악할 수 있도록 하는 것이다. 구체적으로 옵저버빌리티가 가져오는 효과는 무엇일까.

전철민 수모로직 코리아의 테크니컬 매니저는 지난 15일 바이라인네트워크가 주최한 ‘모니터링을 넘어 옵저버빌리티로의 진화’라는 주제의 웨비나에 출연해 옵저버빌리티의 중요성과 활용 사례를 소개했다.

옵저버빌리티가 원활하게 이뤄지려면 충분한 데이터가 필요하다. 크게 세 가지 유형의 데이터가 있다. 시스템이나 애플리케이션에서 나오는 ‘로그’와 애플리케이션 성능 분석 시스템을 통해 나오는 데이터인 ‘트레이스 데이터’, 네트워크 모니터링 시스템에서 나오는 데이터인 ‘메트릭’이 그것이다.

옵저버빌리티를 통해 시스템 신뢰성을 올리기 위해서는 크게 세 단계를 거쳐야 한다. 먼저, 목표치를 정해두고 로그, 매트릭 등을 이용해 그 목표치에 달성하는지 모니터링을 해야 한다. 그런 다음 진단을 하는데, 만약 이슈가 발생했다면 레이턴시를 달성하지 못한 영향 등을 분석할 수 있다. 이때 장애가 일어났다는 진단을 받으면 초동조치로 이어진다.

전철민 매니저는 “초동조치를 했다고 하더라도 궁극적으로 시스템을 개선해야 하는데, 이때 로그를 통해 트로브 슈팅을 하게 된다”며 “따라서 충분한 데이터를 바탕으로 측정, 분석, 개선을 해야 신뢰도 향상을 할 수 있다”고 설명했다.

수모로직의 옵저버빌리티 솔루션 ‘컨티니어스 인텔리전스 플랫폼’

이날 전 매니저는 수모로직이 옵저버빌리티를 위해 만든 솔루션도 소개했다. ‘컨티니어스 인텔리전스 플랫폼’이다. 해당 서비스는 로그 중앙관리 분석 솔루션과 시스템 네트워크 메트릭을 통해 시스템 네트워크 모니터링을 하는 시스템, 애플리케이션 성능관리 솔루션의 기능을 통합했다.

컨티니어스 인텔리전스 플랫폼이 수집하는 데이터는 기업내 모든 장비에서 나온다. 전철민 매니저는 “기업 내에 있는 데이터가 정형화되어 있지 않아도, 또 데이터가 애플리케이션 서비스에서 오든 서버에서 오든, 혹은 사물인터넷(IoT) 보안 장비에서 오는 것이든 모든 장비의 데이터를 수집할 수 있다”고 강조했다.

이어 “데이터 스케일에 상관없이 모두 수집을 하고 검색 분석을 할 수가 있다”며 “분석한 것을 시각화하고 모니터링할 수 있으며, 상황에 따라 기업은 노트를 받을 수 있다”고 말했다.

이러한 특성을 기반으로 하는 만큼 컨티니어스 인텔리전스 플랫폼은 기업의 모든 부서에서 실시간 분석, 인사이트를 다룬다. 웹사이트 사용자 패턴 분석, 보안 인텔리전스 기능이 여기에 해당한다.

수모로직 옵저버빌리티 차별점

컨티니어스 인텔리전스 플랫폼은 클라우드를 기반으로 한다는 점에서 차별화를 추구한다. 클라우드 네이티브 솔루션인 만큼 스케일 인·아웃이 가능하며, 사용한 만큼 요금을 내는 방식이다. 트래픽 급변에 유연하게 대응할 수 있어 비용효율적다.

이밖에도 회사는 글로벌 보안인증 PCI DSS 획득, 여러 기능을 제공하는 쿼리, 데이터 티어 등을 강점으로 꼽았다.

회사의 대표 고객사 중 하나는 삼성전자다.

전철민 매니저는 수모로직의 솔루션을 사용하고 있는 고객 사례를 소개했다. 회사의 대표 고객사 중 하나는 삼성전자다. 삼성전자에서는 스마트홈 플랫폼 ‘스마트띵즈(SmartThings)’를 서비스하고 있는데 여기서 발생하는 데이터 수집, 분석 솔루션으로 수모로직의 컨티니어스 인텔리전스 플랫폼을 채택했다고 전 매니저는 말했다.

삼성전자는 스마트띵즈를 통해 매일 18테라바이트 양의 데이터를 수집하고 있다. 수집한 데이터는 개발팀, 데브옵스 운영 프로젝트 매니지먼트, 고객기술 지원 부서, 경영진 등이 수모로직의 플랫폼을 통해 활용하고 있다.

전철민 매니저는 “스마트띵즈의 경우 기존 툴이 방대한 IoT 데이터를 수집하고 분석하는데 어려움이 있었다”며 “그러나 수모로직을 도입하고 퍼포먼스 저하나 어려움없이 방대한 데이터를 수집, 분석할 수 있었고 현재까지 사용하고 있다”고 설명했다.

수모로직 고객사례

또 다른 고객사례로, 국내 소셜 미디어 언터테인먼트 기업이 있다. 이 기업은 K팝 그룹의 팬 커뮤니티를 온라인으로 운영한다. 이벤트에 따라 트래픽이 폭증하거나 데이터 유입 후 이를 파싱하지 못하는 어려움이 있었다.

해당 사례에서는 데이터 티어 적용으로 기존 대비 20% 이상의 비용절감을 한 것이 눈에 띈다. 이전에는 고객사가 비용절감을 위해 장기 데이터의 경우 S3 스토리지로 포딩한 후 필요할 때마다 다시 수집해서 사용했는데, 수로모직의 데이터 티어를 적용해 불필요한 절차를 해소하고 운영을 효율화했다는 것이 전 매니저 측의 설명이다.

전철민 매니저는 “현재 트래픽 폭증이나 로그유실 없이 사용하고 있으며, 데이터 유입 후에도 파싱할 수 있어 분석을 하고 있다”고 전했다.

글. 바이라인네트워크
<홍하나 기자>0626hhn@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다