클라우드플레어 “미토스의 강점은 공격 체인 구성 능력”
클라우드플레어는 앤드로픽의 인공지능(AI) 모델 ‘클로드 미토스 프리뷰(Claude Mythos Preview)’를 자사 코드에 적용한 결과, 단순 취약점 탐지를 넘어 여러 버그를 하나의 공격 체인으로 연결하는 능력을 확인했다고 18일 밝혔다.
클라우드플레어는 자사 블로그를 통해 글래스윙 프로젝트(Project Glasswing)의 일환으로 미토스 프리뷰를 사용해달라는 초대를 받았다고 설명했다. 이후 50여 개 자체 리포지토리에 모델을 적용해 어떤 취약점을 찾고, 어떤 방식으로 작동하는지 검증했다.
클라우드플레어가 주목한 첫 번째 특징은 ‘취약점 악용 체인’ 구성 능력이다. 실제 공격은 하나의 버그만으로 이뤄지지 않는다. 여러 작은 취약점을 이어 붙여 시스템 제어로 이어지는 경로를 만든다. 클라우드플레어는 미토스 프리뷰가 이런 공격 기본 요소를 조합해 실제 증명으로 연결하는 방식을 추론했다고 평가했다.
두 번째 특징은 ‘개념증명(PoC)’ 생성이다. 개념증명은 취약점이 실제로 악용될 수 있는지 보여주는 검증 코드나 절차를 뜻한다. 클라우드플레어에 따르면 미토스 프리뷰는 의심되는 버그를 유발할 코드를 작성하고, 임시 환경에서 컴파일해 실행했다. 결과가 예상과 다르면 실패 원인을 분석하고 가설을 바꿔 다시 시도했다.
클라우드플레어는 기존 범용 프런티어 모델도 일부 근본적인 버그를 찾을 수 있었다고 밝혔다. 차이는 연결 능력에 있었다. 기존 모델은 흥미로운 버그를 찾고 그 의미를 설명한 뒤 멈추는 경우가 많았다. 미토스 프리뷰는 낮은 심각도의 버그들을 연결해 더 심각한 하나의 익스플로잇으로 구성할 수 있었다는 설명이다. 익스플로잇은 취약점을 실제 공격에 활용하는 행위를 말한다.
다만 클라우드플레어는 미토스 프리뷰의 한계도 지적했다. 모델은 정당한 보안 연구 요청에도 거부 반응을 보였지만, 그 기준은 일관되지 않았다. 같은 코드와 같은 목적의 요청이라도 표현 방식이나 맥락에 따라 전혀 다른 답변을 내놓을 수 있었다. 클라우드플레어는 모델 내부 안전장치만으로는 완전한 안전 경계를 만들기 어렵다고 봤다.
신호와 잡음의 문제도 남았다. 클라우드플레어는 보안 취약점 분류에서 가장 어려운 작업이 실제 버그와 추측성 결과를 가려내는 일이라고 설명했다. 모델은 버그를 찾으라는 요청을 받으면 실제 버그가 있든 없든 결과를 제시하는 경향이 있다. 이런 결과를 사람이 하나씩 확인하면 분류 대기열과 검증 비용이 커질 수 있다.
클라우드플레어는 이를 줄이기 위해 취약점 탐지 하네스를 구축했다. 하네스는 모델이 코드를 분석하고, 버그를 찾고, 다른 에이전트가 반박 검증을 수행한 뒤, 중복을 제거하고, 외부 공격자가 해당 버그에 실제로 도달할 수 있는지 추적하는 운영 체계다. 단일 코딩 에이전트에 전체 리포지토리를 맡기는 방식으로는 충분한 분석 범위를 확보하기 어렵다는 판단이다.
클라우드플레어는 하네스에서 조사, 헌팅, 검증, 갭필, 중복 제거, 추적, 피드백, 보고 단계를 운영했다고 밝혔다. 헌팅 단계에서는 보통 50개 안팎의 헌터 에이전트가 동시에 실행됐다. 각 에이전트는 좁은 범위의 공격 유형을 맡아 개념증명 코드를 컴파일하고 실행할 수 있는 도구에 접근했다.
보안팀 운영 방식도 바뀌어야 한다는 지적도 나왔다. 클라우드플레어는 일부 팀이 공통 취약점 및 식별(CVE) 공개부터 운영 환경 패치까지 2시간 서비스수준협약(SLA)을 기준으로 움직이고 있다고 전했다. 하지만 패치 속도만 높여서는 충분하지 않다고 봤다. 회귀 테스트에 하루가 걸리는 환경에서 2시간 안에 패치하려면 테스트를 건너뛰어야 하고, 이 과정에서 더 큰 장애나 보안 문제가 생길 수 있다는 설명이다.
클라우드플레어는 핵심 과제가 속도 자체가 아니라 아키텍처라고 강조했다. 버그가 존재하더라도 공격자가 악용하기 어렵게 만들고, 애플리케이션 앞단에서 공격 경로를 차단해야 한다는 것이다. 코드 한 부분의 결함이 전체 시스템 접근으로 이어지지 않도록 설계하고, 여러 실행 환경에 동시에 수정 사항을 배포할 수 있는 구조도 필요하다고 설명했다.
이어 클라우드플레어는 이번 연구가 통제된 환경에서 자사 코드 대상으로 진행됐다고도 밝혔다. 이 과정에서 발견한 취약점은 정식 취약점 관리 절차에 따라 분류, 검증, 수정했다고 했다.
글. 바이라인네트워크
<곽중희 기자>god8889@byline.network



