스플렁크 “옵저버빌리티 리더기업, 연간 ROI 2.6배”
옵저버빌리티를 잘 확보한 기업이 운영 효율성과 가동 시간 등에서 이점을 얻어 연간 2.6배의 투자 대비 수익(ROI)을 달성하는 것으로 조사됐다.
스플렁크는 리서치기업 ESG와 함께 이같은 내용의 ‘2024 옵저버빌리티 현황(The State of Observability 2024)’ 보고서를 13일 발표했다.
이 글로벌 연구는 점점 더 복잡해지는 IT 환경과 높아지는 고객의 기대 속에서 옵저버빌리티의 역할을 조명한다.
각 기업은 문제를 더 신속하게 해결하고, 개발자 생산성을 높이며, 비용을 효율적으로 관리하고, 고객 만족도를 향상시키고 있다. 이러한 성과로 인해 전체 응답자의 86%가 옵저버빌리티에 대한 투자를 확대할 계획이라고 답했다. 1850명의 IT옵스(ITOps) 및 개발자를 대상으로 설문조사를 진행한 이 연례 보고서는 옵저버빌리티 업계에 대한 종합적인 분석을 제공한다.
선도적인 옵저버빌리티는 저절로 만들어지는 것이 아니라 전략적으로 구축된다. 이 보고서는 옵저버빌리티 성숙도를 4단계로 구분한 새로운 성숙도 프레임워크를 제시한다. 각 단계는 근본적인 가시성, 가이드를 바탕으로 한 인사이트, 선제적 대응, 그리고 통합형 워크플로우로 나뉜다. 응답자들은 이 프레임워크에 따라 ‘초기 단계’ 기업(45%), ‘신흥’ 기업(27%), ‘성장 중인’ 기업(17%), 그리고 ‘리더’ 기업(11%) 중 하나로 분류됐다.
기업은 선도적인 옵저버빌리티 업무를 도입함으로써 전체 디지털 자산(digital footprint)을 파악하고 다운타임의 영향을 줄일 수 있다. 리더 기업의 68%는 가동 중단 발생 후 몇 분 또는 몇 초 내에 애플리케이션 문제를 인지한다고 답했으며, 이는 초기 단계 기업보다 2.8배 더 빠른 속도다. 또한, 리더 기업은 경보의 80%가 실제 문제로 확인된다고 응답한 반면, 초기 단계 기업에서는 이 비율이 54%에 그쳤다. 이에 따라 리더 기업은 경보의 신뢰도가 높아 불필요한 경보에 소요되는 시간을 줄일 수 있었다. 고객이 원활하고 안전한 디지털 경험을 기대하는 수준이 사상 최고조에 달한 만큼, 이러한 정확도와 대응 시간의 차이는 매우 중요하다. 연구에 따르면 다운타임은 고객 충성도를 저하시킬 뿐만 아니라 대중의 인식에도 부정적인 영향을 미칠 수 있다.
속도는 리더 기업이 소프트웨어 개발 속도에서 경쟁 우위를 확보하는 핵심 요소다. 리더 기업의 76%는 필요할 때마다 애플리케이션 코드를 배포하는 반면, 초기 단계 기업에서는 그 비율이 30%에 불과하다. 또한 리더 기업의 개발자는 초기 단계 기업에 비해 혁신에 38% 더 많은 시간을 할애하며, 이는 문제 해결이나 인시던트 분류 같은 반복적이고 번거로운 작업에 더 적은 시간을 투자하게 됨을 의미한다. 리더 기업에서는 개발자의 생산성과 성과가 높아질수록 수익성도 함께 향상되는 것이 분명하다.
오픈텔레메트리는 옵저버빌리티 데이터 수집에 대한 업계 표준의 오픈소스 접근 방식으로, 점점 더 널리 도입되고 있다. 클라우드 네이티브 컴퓨팅 재단(CNCF) 프로젝트를 통해 조직은 데이터를 효과적으로 제어하고 벤더 종속성을 완화할 수 있다. 보고서에 따르면 응답자의 58%가 자사에서 사용하고 있는 옵저버빌리티 솔루션이 오픈텔레메트리에 의존한다고 답해, 오픈텔레메트리가 효과적인 옵저버빌리티의 토대임을 강조하고 있다.
오픈텔레메트리는 혁신과 회복탄력성을 상징한다. 리더 기업의 78%가 오픈 소스 표준을 채택하고 있으며 57%는 옵저버빌리티 비용 절감을 경험하고 있다.
오픈텔레메트리는 뛰어난 유연성을 제공한다. 리더 기업의 72%는 광범위한 기술 생태계에 접근하기 위해 오픈텔레메트리를 도입했으며, 65%는 오픈 소스 프로젝트가 데이터 제어 및 소유권 관리를 더 잘 지원한다고 답했다.
옵저버빌리티에서 AI와 머신러닝은 이제 선택이 아닌 필수다. 거의 모든 설문조사 응답자(97%)가 옵저버빌리티 운영을 개선하기 위해 AI와 함께, 또는 따로 머신러닝 기반 시스템을 사용하고 있으며, 이는 작년 조사 결과(66%) 대비 크게 증가한 수치다. AI와 머신러닝은 대량의 데이터를 분석하고 처리하여 이상 징후를 감지하고, 근본 원인을 파악하며, 대책을 제안하고 작업을 자동화함으로써 팀이 필요한 인사이트를 더 신속하게 확보할 수 있도록 도와준다.
응답자의 57%가 수신되는 경보의 양이 문제라고 지적한다. 그러나 리더 기업의 85%는 AI와 머신러닝 기반 도구의 추천을 통해 경보의 절반 이상을 해결하여 경보 노이즈가 훨씬 적은 것으로 나타났다. 반면, 초기 단계 기업에서는 단 16%만이 동일한 성과를 보였다. 리더 기업의 65%는 더 뛰어난 인텔리전스와 자동화를 통해 사고의 근본 원인을 찾아내고 해결하기 위해 AI옵스를 활용하고 있다.
응답자의 73%가 플랫폼 엔지니어링을 광범위하게 도입했으며, 이를 통해 개발자 경험을 강화하고 주도하고 있다. 플랫폼 엔지니어링의 핵심은 소프트웨어 엔지니어가 공통 툴체인, 워크플로우, 그리고 셀프 서비스 플랫폼을 활용해 툴 관리에 소요되는 시간을 줄이고, 새롭고 혁신적인 제품을 시장에 출시하는 데 더 집중할 수 있도록 하는 접근 방식이다. 응답자의 66%가 지난 1년 동안 핵심 인력이 번아웃으로 인해 퇴사했다고 답한 만큼, 플 플랫폼 엔지니어링은 과중한 업무에 시달리는 IT 운영 및 엔지니어링 팀에게 반가운 해결책이 되고 있다.
플랫폼 엔지니어링 전담 팀을 보유한 조직은 이미 성과를 거두고 있다. 플랫폼 엔지니어링의 주요 성과 세 가지를 묻는 질문에 응답자의 55%는 IT 운영 효율성 향상, 42%는 애플리케이션 성능 개선, 40%는 개발자 생산성 향상을 꼽았다. 리더 기업의 58%는 플랫폼 엔지니어링을 차별화된 경쟁 요소로 인식하고 있다.
패트릭 린 스플렁크 옵저버빌리티부문 수석부사장 겸 총괄 책임자는 “선도적인 옵저버빌리티 업무 구축이란 고객에게 우수한 디지털 경험을 제공하는데 집중하고, 이러한 마인드를 모든 의사 결정에 깊이 내재화하는 것을 의미한다”며 “스플렁크 보고서는 이러한 사고방식이 성과로 이어진다는 것을 보여준다”고 밝혔다.
그는 “리더 기업들은 다운타임 최소화하는 데 더 큰 성공을 거둘 뿐만 아니라 개발자의 혁신과 속도에서도 더 큰 성과를 달성하고 있다”고 덧붙였다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network