‘미토스’로 버그 271개 발견된 파이어폭스, 오히려 “빛이 보인다”
베일에 쌓인 앤트로픽의 최신 AI 모델 클로드 미토스(Mythos)의 제한 공개 후 오픈소스 소프트웨어 진영의 보안 우려가 커지고 있다. 이런 가운데 파이어폭스 브라우저 개발을 주도하는 모질라가 클로드 미토스 모델 초기 평가에 참여해 브라우저 최신 버전에서 271개의 취약점을 찾아냈고, 대량의 버그 발생에 대한 대응의 고통을 밝혔다. 그러면서도 향후 제로데이 공격에서 벗어날 수 있다는 희망적 메시지도 냈다.
바비 홀리 모질라 최고기술책임자(CTO)는 지난 21일 ‘제로데이는 이제 얼마 남지 않았다’란 제목의 블로그에서 앤트로픽 클로드 미토스 사용 경험을 공유했다.
그에 따르면, 지난 2월부터 파이어폭스팀은 파이어폭스 브라우저의 보안 버그를 찾기 위해 첨단 AI 모델을 활용했다. 이미 앤트로픽 오푸스 4.6 모델을 활용해 파이어폭스 148 버전에서 22개의 중요한 버그를 찾아내 수정했다. 그리고, 프로젝트 글래스윙에 참여해 클로드 미토스 프리뷰를 사용해 가장 최근 버전인 파이어폭스 150 버전에서 271개의 보안 취약점을 찾았다고 한다.
바비 홀리 CTO는 “이런 기능이 더 많은 수비팀의 손에 들어가면서, 다른 많은 팀도 처음 이런 발견이 알려졌을 때 느껴졌던 것과 같은 어지럼증을 경험하고 있다”며 “2025년 당시에는 견고한 목표물에 이러한 버그 하나만 있어도 심각한 위협이었을 텐데, 이렇게 많은 버그가 동시에 발생하니 과연 대응 가능한 지 의문 들 정도”라고 밝혔다.
미토스의 뛰어난 사이버 역량은 바이너리에서 소스코드를 역설계하고, 사람이 쉽게 찾지 못하는 보안 취약점을 발견하게 해주는 것으로 유명하다. 미토스뿐 아니라 AI 모델 고도화로 숨어있던 보안 취약점이나 버그를 AI로 대거 찾아내는 상황이 곳곳에서 벌어지고 있다. 특히 소스코드를 공개하는 오픈소스 소프트웨어 진영은 급격히 증가하는 보안 버그 리포트를 한정된 유지관리자가 처리하기 버거워하고 있다.
바비 홀리는 그럼에도 “우리의 경험은 어지럼증을 떨쳐내고 일에 몰두하는 팀들에게 희망을 주는 사례”라며 “다른 모든 일의 우선순위를 재조정하고 오로지 일에만 집중해야 할 수도 있지만, 터널 끝에는 빛이 있다”고 적었다.
그는 “아직 할 일은 남아 있지만, 우리는 고비를 넘겼고 현재 수준을 유지하는 것보다 훨씬 더 나은 미래를 볼 수 있게 됐다”며 “수비수들이 드디어 결정적인 승리를 거둘 기회를 얻게 됐다”고 설명했다.
당장 버그의 발견 양이 폭발적으로 늘더라도 제대로 된 체계를 갖춰 지금의 고비를 잘 넘기면, 향후 공격자의 취약점 발견을 줄여 선제적인 보안 대응이 가능해질 것이란 얘기다.
그는 “지금까지 업계는 보안 문제에 대해 대체로 대등한 입장을 유지해 왔다”며 “파이어폭스와 같이 인터넷에 노출되는 핵심 소프트웨어 공급업체들은 보안을 매우 중요하게 생각하며, 매일 아침 사용자 안전을 위한 방법을 고민하는 팀을 운영하고 있음에도 익스플로잇을 완전히 없애는 것이 비현실적인 목표라는 것을 오랫동안 묵묵히 인정해 왔다”고 적었다.
그는 “대신, 우리는 익스플로잇을 매우 비싸게 만들어 사실상 무제한의 예산을 가진 공격자만이 사용할 수 있도록 하고, 그러한 고가의 자산을 파괴하는 데 드는 비용 때문에 공격자들이 일상적인 사용을 자제하도록 유도하는 것을 목표로 삼았다”며 “공격 대상 영역이 무한하지는 않지만, 현재 우리가 보유한 도구로는 완벽하게 방어하기 어려울 정도로 충분히 넓고, 이는 공격자에게 비대칭적인 이점을 제공하는데, 그들은 방어벽의 허점 하나만 찾아내면 되기 때문”이라고 덧붙였다.
그는 사람의 개입없이 버그를 찾아내는 퍼징 도구(Fuzzer)를 개선함으로써 보안의 판도를 바꿀 수 있다고 강조했다.
그는 “심층 방어 엔지니어링과 함께 자동화 분석 기술의 최첨단을 유지하는 임무를 맡은 내부 레드팀은 최근까지 주로 퍼징과 같은 동적 분석 기법을 활용했다”며 “퍼징은 실제로 매우 효과적이지만, 코드의 일부는 퍼징하기 어렵고 다른 부분은 그렇지 않아 코드 커버리지가 고르지 못하게 되는 문제가 있다”고 지적했다.
그는 “최고 수준의 보안 연구원들은 퍼저로 찾을 수 없는 버그를 소스 코드 분석을 통해 찾아내고, 이는 효과적이지만 시간이 많이 소요되고, 부족한 전문 인력에 의존해야 하는 병목 현상이 발생한다”며 “세계 최고의 보안 연구원들이 수행한 작업을 분석해 온 오랜 경험을 바탕으로 미토스 프리뷰를 개발했고, 인간이 찾아낼 수 있는 모든 유형과 복잡성의 취약점을 이 모델이 찾아낼 수 있다는 것을 확인했다”고 밝혔다.
이어 “이는 당장은 매우 두려운 일처럼 느껴질 수 있지만, 장기적으로는 방어자에게 희소식”이라며 “기계가 발견할 수 있는 버그와 사람이 발견할 수 있는 버그 사이의 격차는 공격자가 하나의 버그를 찾기 위해 수개월 동안 값비싼 인력을 투입할 수 있기 때문에 그들에게 유리하게 작용하지만, 이러한 격차가 줄어들면 모든 버그 발견 비용이 저렴해지므로 공격자의 장기적인 이점이 약화된다”고 설명했다.
그는 엘리트 인간 연구원이 발견하지 못한 버그를 미토스로도 발견하지 못했다고 밝혔다. 일부에서 미래의 미토스 모델이 악의적 공격자에게 악용돼 아무도 찾지 못했던 취약점에서 중대한 사고를 일으킬 것이란 전망은 과도하다는 지적과 함께다.
그는 일부 평론가들은 미래의 AI 모델이 현재 우리의 이해를 초월하는 완전히 새로운 형태의 취약점을 발견할 것이라고 예측하지만, 우리는 그렇게 생각하지 않는다”며 “파미어폭스와 같은 소프트웨어는 인간이 그 정확성에 대해 추론 할 수 있도록 모듈식으로 설계됐고, 복잡하지만 임의로 복잡하지는 않다”고 밝혔다.
그는 “결함은 유한하며, 우리는 마침내 모든 결함을 찾아낼 수 있는 세상으로 진입하고 있다”고 강조했다.
미토스에 대한 오픈소스 진영의 우려가 가장 극단적으로 나타난 사례는 ‘칼닷컴(Cal.com)’이다. 칼닷컴은 오픈소스 일정관리 자동화 도구다. 구글캘린더, 아웃룩, 애플캘린더 등과 연동돼 사용자의 실시간 일정을 파악하고, 줌이나 구글미트 등 화상회의도구의 링크를 생성해준다. 그런데 칼닷컴의 베일리 펌프릿은 지난 15일 X를 통해 “오픈소스는 죽었다”며 칼닷컴의 라이선스를 오픈소스인 AGPL에서 독점 라이선스로 전환한다고 밝혔다. AI가 보안에 너무 큰 위협이어서 소스코드를 공개해두는 대신 감추겠다는 것이다.
그는 “코드는 더 이상 단순히 읽는 데 그치지 않고, 거의 비용 없이 스캔되고, 매핑되고, 악용된다”며 “이런 세상에서는 투명성이 곧 노출이고, 특히 규모가 커질수록 더욱 그렇다”고 설명했다.
그는 “이는 오픈 소스가 우리에게 준 것을 부정하는 것이 아니라, AI가 만들어내는 위험에 대한 대응”이라며 “취미로 무언가를 만드는 사람들을 위해 MIT 라이선스를 사용하는 새로운 오픈소스 프로젝트인 cal.diy를 통해 핵심 코드를 공개할 예정”이라고 덧붙였다.
그는 영상에서 오픈소스 코드는 마치 은행의 금고 설계도를 넘겨주는 것과 같으며, 그 설계도를 연구하는 해커가 100배 더 많아졌다고 강조했다.
오픈소스 소프트웨어 전문기자 스티븐 J 본-니콜스는 칼럼에서 “오픈소스가 죽었다고 칼닷컴의 공동 창립자이자 CEO인 베일리 펌프릿이 말하지만, 리눅스 커널 관리자인 그렉 크로아하트먼 같은 최고의 오픈소스 개발자와 대화를 통해 오픈소스는 죽지 않는다는 것을 알게 됐다”고 평가했다.
오픈소스 소프트웨어가 소스코드 공개 때문에 보안에 취약하다는 논란은 해묵은 논쟁이다. 주로 독점 소프트웨어 기업에서 제기한 프로파간다였지만 실제 시장에서 오픈소스 코드의 독점 코드 대비 보안 우월성은 이미 입증됐다. 문제는 소스코드 공개 그 자체가 아니라, 발견된 취약점에 얼마나 기민하게 대처하는가다.
본-니콜스 기자는 “AI를 사용하면 새롭게 발견된 보안 취약점을 발견 즉시 수정할 수 있다는 장점도 있다”며 “칼은 분명히 그런 위험을 감수하고 싶어하지 않거나, 펌플릿은 회사가 그럴 만한 여유가 없다고 생각하는 것”이라고 꼬집었다.
그는 “AI는 오픈소스 프로그래밍을 근본적으로 변화시키고 있고, 내년 이맘때 오픈소스 코딩이 어떤 모습일지 확신할 수 없다”며 “하지만 한 가지 확실한 것은 낡고 신뢰를 잃은 독점 라이선스 모델로 회귀하기보다는 AI와 오픈 소스를 함께 활용하는 방법을 배우는 것이 훨씬 더 나을 것이란 점”이라고 지적했다.
AI를 오픈소스 소프트웨어 보안 체계에 도입하면, 본연의 장점인 규모의 경제 면에서 AI의 역량도 훨씬 더 커진다. 코드 감사에 들어가는 토큰 비용이 커뮤니티에서 공유되는 것과 같기 때문에, 모든 코드 감사에 회사 내부 직원만으로 대응해야 하는 독점 소프트웨어보다 유리하다는 얘기다.
본-니콜스는 슬래시닷의 한 댓글을 소개했다. 해당 댓글을 단 사용자는 “만약 도구가 너무 훌륭해서 보안 취약점이 드러날까봐 두렵다면 차라리 그 도구를 사용해서 직접 보안 취약점을 찾아내고 수정하는 게 낫다”며 “보안을 숨김으로써 확보했다고 주장하는 건 어리석은 짓이며, 제품이 수익성을 확보했으니 오픈소스 커뮤니티에서 발을 빼고 싶어하는 속셈을 감추려는 변명에 불과하다”고 적었다.
기술전략가 브류 브루니그는 “취약점을 찾는 것은 명확하게 정의되고 검증 가능한 검색 문제로, 복잡한 시스템을 구축하는 것이 아니라 이미 존재하는 시스템을 건드리는 것”이라며 “시스템을 강화하려면 공격자가 취약점을 악용하는 데 사용하는 토큰보다 취약점을 발견하는 데 더 많은 토큰을 사용해야 한다”고 밝혔다.
그는 “이전에는 보안 감사가 드물고, 간헐적이며, 일관성이 없었지만, 이제 최적의 예산 내에서 지속적으로 보안 감사를 실시할 수 있게 됐다”고 덧붙였다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network



