AWS의 AI IDE ‘키로’ 너무 많이 써서 문제
지난달 아마존웹서비스(AWS)에서 공개한 생성형 AI 기반 통합개발환경(IDE) ‘키로(Kiro)’가 너무 많은 인기에 한달만에 대기자 명단과, 새로운 가격 정책을 도입했다. 일관적이지 못한 바이브코딩의 문제를 해결하려 도입한 소프트웨어 스펙 기반 개발 방식은 호평을 이끌었지만, 이내 개편된 새 가격 정책은 고비용 논란을 일으켰다.
지난달 16일 공개된 키로는 AI 에이전트 기반 IDE로키로는 자연어 프롬프트 입력으로 애플리케이션을 생성할 수 있고, 프로젝트를 현업 시스템 단계에서 운영할 수 있는 자동화 기능을 제공한다. 아이디어부터 코드 구현, 프로젝트 관리 등 전체 개발 및 운영 과정을 AI 에이전트를 통해 진행할 수 있다.
키로는 AWS와 별개로 이용 가능한 단독 서비스다. AWS 외에 마이크로소프트 애저나 구글클라우드 같은 퍼블릭 클라우드를 원하는 인프라로 활용할 수 있다.
키로는 프리뷰 버전임에도 폭발적 반응을 얻었다. AWS는 급증한 사용량 때문에 공개 후 일주일 만인 21일 일일 사용량 한도와 사용자 대기 명단 제도를 도입했다. 그러면서 당초 공지했던 가격 정책을 삭제했다.
최영준 AWS코리아 데이터/인공지능 스페셜리스트 SA 리더는 19일 AWS코리아에서 개최된 기자간담회에서 “AI 코딩 도구들은 작은 작업에는 효과적일 수 있지만 실제 복잡한 프로젝트에는 한계를 보이고 있다”며 “현존하는 도구들은 AI 에이전트와 효과적으로 협업하고 체계적으로 관리하기 위한 충분한 기능을 제공하지 못하는 경우도 있다”고 말했다.
그는 “코드 품질에 대한 관리 체계를 엄격하게 유지하면서 PoC 단계에서 실제 운영 환경으로 전환하는 과정에서 복잡한 양상들 보이고 있는데 이것을 유지하기가 쉽지는 않다”며 “이를 위해서 만들어진 서비스가 AI 통합 개발 환경인 키로”라고 설명했다.

키로는 복잡한 프로덕션 앱을 구현해 운영하기 힘들다는 바이브코딩의 문제를 해결하는 새로운 방법을 채택했다. 커서, 클로드코드, 깃허브 코파일럿 등 바이크보딩에 사용되는 AI 코딩 도구는 디버깅과 수정에 많은 시간을 투입하게 하고, 생성한 코드를 유지보수하기 힘들다.
코드베이스가 커지고 복잡해지면 일관성을 유지하기 위해 너무 많은 지침이 필요할 수 있다. AI에이전트가 맥락을 잘못 해석해 오류를 만들 수도 있다.
키로의 스펙 기반 개발 방식은 바이브코딩으로 실제 코드를 작성하기 전 단계로 요구 사항, 시스템 설계 및 구현할 작업을 정의한 스펙(명세서)을 먼저 생성한다. 명세서는 추론 및 구현 결정을 명확하게 문서화하고, 키로는 이후 작업을 명세서에 기반해 수행한다. 이를 통해 더 적은 샷으로 더 복잡한 작업을 구현할 수 있다는 게 AWS의 설명이다.
최영준 리더는 “키로는 개발자의 프롬프트를 소프트웨어 명세 스펙으로 변환하고, 이를 기반으로 반복적으로 개선하면서 코드와 문서 테스트를 생성한다”며 “에이전트 후크를 통해 파일 저장과 같은 이벤트 트리거를 저장했다가 사전에 정의된 프롬프트에 따라서 백그라운드에서 자율적으로 실행되거나, 문서를 작성하거나, 단위 테스트, 코드 최적화 등에 대한 작업을 확장할 수 있다”고 말했다.
그는 “다양한 문서, 마크다운 파일들을 프로젝트에 대한 지속적인 지식 저장을 하기 위해서는 에이전트 스트리어링을 제공하고, 여러 MCP 툴과 데이터베이스 API 등을 연결할 수 있는 다양한 컨텍스트 관리 기능을 제공함으로써 클라우드에 구애받지 않고 또 어떤 플랫폼과도 작동하면서 필요에 따라서는 AWS의 전문성을 활용할 수 있는 IDE”라고 강조했다.
애초 공개된 가격 정책에 따르면, 미리보기 기간동안 키로를 무료로 이용할 수 있지만, 정식 출시 후 월 50건의 에이전트 상호작용을 제공하는 무료 등급, 1000건의 상호작용을 제공하는 프로 등급(월 19달러), 3000건의 상호 작용을 제공하는 프로플러스 등급(월 39달러) 등으로 공지됐다. 추가적인 상호작용은 건당 0.04달러였다.

AWS는 이달 1일 키로의 새 가격 정책을 게시했다. 일단 키로의 AI 에이전트에 던지는 요청을 ‘스펙 요청’과 ‘바이브 요청’으로 나눴다. 스펙 요청은 키로를 구조화된 개발 워크플로 내에서 작업을 실행하는 것이다. 바이브 요청은 코드 설명 및 버그 수정과 같은 채팅 기반 상호작용을 포함한다.
새 가격정책에 따르면, 무료 등급은 바이브요청 월 50건을 이용할 수 있다. 무료 등급에서 스펙을 생성할 수 없게 됐다. 프로 등급은 20달러로 인상됐고 바이브요청 225건과 스펙 요청 125개를 제공한다. 프로프러스 등급은 월 40달러에 바이브요청 450건과 스펙 요청 250건을 제공한다.
그리고, 원래 없었던 최고사양 플랜으로 파워 등급이 생겼다. 파워 등급은 월 200달러에 바이브요청 2250건과 스펙요청 1250건을 제공한다. 추가 바이브요청은 개당 0.04달러이며, 스펙요청은 개당 0.20달러다.
키로의 핵심은 스펙 생성인데 무료 등급에서 스팩 요청을 할 수 없게 됐고, 전반적으로 AI 에이전트에 내릴 수 있는 요청 수가 줄어든 것이다.
키로 깃허브에 안토니오 리베이로란 이름의 개발자가 새 가격정책에 불만을 제기했다. 그는 “8월 16일 새로운 가격을 보기 전까지 키로의 스펙 기반 AI IDE는 정말 훌륭했다”며 “마치 기업 코더를 위한 전용기를 만들어 놓고 나 같은 취미인은 디지털 고속도로 앞에서 히치하이킹을 하는 것 같다”고 적었다.
그는 “바이브와 스펙 요청의 배분은 너무 엉망진창이고, 비용이 너무 비싸다”며 “요청을 ‘바이브(채팅 플래닝, 개당 0.04달러)’와 ‘스펙(코드 실행, 개당 0.20달러)’으로 나누는 것은 산소와 햇빛을 따로 청구하는 것과 같다”고 지적했다.
그는 “바이브 요청은 담당자가 채팅이 너무 복잡하다며 스헥 요청으로 바꾸라고 끊임없이 재촉하기 때문에 쓸모가 없다”며 “마치 잠 못 이루려고 1달러짜리 커피 대신 20달러짜리 수제 라떼를 사라는 식으로 강요하는 것”이라고 적었다.
그는 최근에 키로에서 시도한 새로운 기능을 예로 들어 비용을 계산했다. 계획 단계에서 요구사항에 대한 3개의 바이브요청(2개의 채팅)을 하고, 디자인 단계에서 바이브요청 2개(채팅 1개)를 수행했다. 작업 단계에서 37개의 작업을 생성하려 2개의 바이브 요청을 했고, 실행 단계에서 37개 작업으로 스펙 요청 111건을 처리했다.
리베이로는 “기능 하나에 22달러가 들고, 같은 가격이면 실제 컴퓨터를 살 수 있다”며 “이 분할은 리소스 낭비이며, 바이브요청은 거의 건드리지 않으면서 의미 있는 작업을 하려면 비싼 스펙 요청을 해야 한다”고 밝혔다. 이어 “다른 IDE는 스펙에 비용을 청구하지 않고 파일이나 채팅에서 무료로 생성한다”며 “단일 할당량으로 리소스와 정신 건강을 절약할 수 있는데 굳이 두가지 요청으로 작업을 복잡하게 만들 필요가 있냐”고 덧붙였다.
그에 의하면, 매일 3~4시간씩 월 30일씩 가벼운 코딩을 할 경우 한 달에 최소 3000건의 스펙 요청을 처리한다. 8~10시간의 풀 코딩의 경우 한달에 6000~1만건의 스펙요청을 처리할 수 있다.
키로 프로플러스 구독의 경우 스펙요청 250건을 제공하므로, 가벼운 코딩 상황에서 이틀에서 사흘이면 기본 제공량을 소진한다. 풀 코딩인 경우 하루 이틀이면 소진하게 된다. 초과한 작업을 하려면 가벼운 코딩에 월 590달러, 풀 코딩에 월 1990달러를 추가로 지불해야 한다.
키로 파워 구독의 경우 스펙요청 1250건을 제공하므로, 가벼운 코딩에서 12~13일이면 기본 제공량을 소진한다. 풀 코딩에서 6000건을 요청해야 하면 6~7일 내에, 1만건을 요청해야 하면 4일 내에 소진된다. 가벼운 코딩이면 월 550달러, 풀코딩이면 1150~1950달러를 더 내야 한다.
그는 경쟁사와 키로의 요금제도 비교했다. 아마존Q는 요청 1000개에 20달러, 3000개에 40달러면 이용 가능하다. Trae는 무제한으로 요청할 수 있지만 무료 계층의 속도가 느리다. VS코드와 깃허브코파일럿은 오픈AI GPT-4.1에서 500개 무료 요청과 스펙 유사 기능을 제공한다. 커서는 20달러에 무제한으로 이용 가능하다. 윈드서프는 500건 요청당 15달러이며 모델을 유연하게 선택해 비용을 조절할 수 있다.
그는 “바이브와 스펙 분할은 혼란스러울 뿐 아니라 비효율적이며, 에이전트는 스펙요청으로 유도하기 때문에 바이브요청을 사용하지 않고 할달량을 불필요한 것에 낭비하게 된다”며 “게다가 스펙요청은 너무 비싸서 마치 사막의 물처럼 낭비한다”고 주장했다.
그의 게시글에 달린 댓글에서 여러 사용자가 “사기”라고 비난했다. 일부 사용자는 키로의 원천인 오픈소스 VS코드 프로젝트 측에 스펙 생성 기능을 만들어달라고 요청했다고 밝혔다. 키로가 VS코드의 오픈소스 프로젝트인 ‘코드OSS’를 기반으로 만들어졌기 때문이다. 커뮤니티 정책에 따라 개발자의 VS코드 스펙 기능 구현 요청은 20개 이상의 추천을 받아 백로그로 넘어갔다. 마이크로소프트 주도로 VS코드와 깃허브 코파일럿에 스펙 생성 기능이 생길 수 있게 됐다.
AWS는 지난 15일 새로운 가격 정책을 시행했다. 아마존Q 디벨로퍼 구독 계정없이 구글, 깃허브, AWS 빌더 ID 등의 계정으로 로그인하는 사용자는 새로운 요금제로 전환됐다. 모든 신규 사용자는 무료 계층에 포함되고, 모든 사용자는 기본 할당량에 더해 스펙요청 100건과 바이브요청 100건을 환영 보너스로 지급받는다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network