(출처=오픈AI)
|

GPT-5.5 토큰 가격 2배 올랐다고?

오픈AI는 GPT-5.5를 출시하면서 토큰 비용을 이전 버전보다 2배 올렸다. 오픈AI는 효율성 향상으로 실제 사용 비용을 비슷하게 유지한다고 설명하지만, 실제 사용자의 체감은 다르다. 효율성을 감안해도 종전보다 토큰 비용이 늘어난다는 게 일반적 의견이다.

최근 오픈AI는 GPT-5.5를 출시하면서 API 가격을 100만 토큰 당 입력 5달러, 캐시 입력 0.50달러, 출력 30달러라고 공지했다. 이전 버전인 GPT-5.4의 경우 입력 2.50달러, 캐시 입력 0.25달러, 출력 15달러였다.

GPT-5.5는 이전 모델보다 사용자 의도를 빠르게 파악하고 더 많은 작업을 스스로 수행한다고 설명된다. 코드 작성 및 디버깅, 온라인 리서치, 데이터 분석, 문서 및 스프레드시트 작업, 소프트웨어 조작 등의 복잡한 작업에서 여러 도구를 오가며 높은 성능을 발휘한다고 한다.

특히, 동일한 코덱스 작업을 완료하는 데 훨씬 더 적은 토큰을 사용한다고 강조한다. 아티피셜애널리시스의 코딩 인덱스에서 경쟁 프런티어 코딩 모델 대비 절반 수준의 비용으로 최고 수준의 인텔리전스를 제공한다고 밝혔다.

오픈AI는 “GPT-5.5는 GPT-5.4보다 가격이 높지만, 더 지능적이며 토큰 효율성도 훨씬 더 높다”며 “코덱스에서 대다수의 사용자에게 GPT‑5.5가 GPT‑5.4보다 더 적은 토큰으로 더 나은 결과를 제공하도록 사용 경험을 세심하게 조정했으며, 동시에 모든 구독 등급에서 넉넉한 사용량을 계속해서 제공한다”고 설명했다.

20달러나 200달러 수준의 월정액제 가입자라도 토큰 비용은 민감한 문제다. 챗GPT, 코덱스 플러스, 프로, 비즈니스, 엔터프라이즈 등의 요금제는  기본적으로 정액제지만, 에이전틱 기능을 비롯한 API 기반 작업의 경우 사용량 기반으로 과금한다. 단순한 답변을 받는 채팅 위주 사용은 크게 문제되지 않지만, 에이전트 기반으로 작업하면 토큰 비용을 제어하기 힘들다. 기본 할당 토큰량을 초과하면 작업을 중지하거나, 추가 비용을 지불해야 한다.

오픈라우터의 분석에 의하면, GPT-5.5의 토큰 비용은 이전보다 49~92% 증가하는 것으로 나타났다. 프롬프트가 길어질수록 모델이 완료 토큰을 19~34% 적게 생성함으로써 가격 인상폭이 완화된다고 한다.

1만개 이상의 토큰을 사용하는 프롬프트의 경우 19~34% 더 적은 토큰을 생성하고, 더 짧은 프롬프트의 경우 증가하는 경향을 보였다. 2000개 미만의 토큰을 사용하는 경우 완성된 텍스트 길이는 거의 동일하지만, 2000~1만개 범위에서 52% 더 길어진다고 한다. 1만 토큰을 넘기는 긴 프롬프트의 경우 완료 시간 단축으로 비용 인상을 상쇄하지만, 1만 토큰 미만의 짧은 프롬프트에서 완료 시간이 단축되지 않아 비용 증가폭이 더 커졌다.

그동안 AI 전문가들은 오픈AI, 앤트로픽 등의 프론티어 모델 스타트업이 사업 초기 사용자를 모으기 위해 추론 비용을 낮게 책정해 제공해왔다는 의견을 밝혀왔다. 대규모 외부 투자를 통해 서비스 비용 지출 부분을 수혈하면서 소비자를 유지하는 적자 구조다. 보도에 의하면, 오픈AI는 올해 140억달러의 손실을 볼 것으로 예상되며, 앤트로픽은 올해 110억달러 손실을 볼 것으로 예측된다.

전문가들은 만약 시장이 안정되면 서비스 비용을 소비자 가격에 반영하면서 가격을 올릴 것이라고 전망해왔다. 그리고, 이런 전망은 최근 들어 현실화되고 있다. 앤트로픽은 클로드 오푸스4.7의 경우 2000개 이상의 토큰을 필요로 하는 프롬프트에서 실제 비용이 12~27% 증가하는 것으로 분석됐다.

AI 사용자들은 프론티어 모델의 성능의 향상 수준은 줄어드는 반면, 비용은 증가하고 있다고 불만을 제기하고 있다. 점차 많은 추론을 사용하면서 토큰 증가가 커지고 있으며, 토큰 압박에 시달린다는 불평이 많다.

AI 비용이 점차 오르는 현상은 AI 서비스 기업의 컴퓨팅 인프라 제약과 연관된다. 앤트로픽은 연초 급격한 사용량 증가에 대응하기 위해 오푸스4.7에서 토크나이저를 개선해 효율을 높이려 했는데 역으로 성능 하락을 유발해 곤혹을 치렀다. 서비스 수요를 인프라 공급 속도가 따라 잡지 못하는 상황에서, AI 기업의 운영비 부담은 커지고 있다. 막대한 자본금을 유치하고, 기업공개(IPO)도 발빠르게 준비하고 있지만 적자폭을 메울 시점은 요원해보인다.

사용자의 걱정은 당면한 비용 상승보다 성능 향상 병목에 도달한 것 아니냐는 점이다. 전처럼 프론티어 모델의 성능과 기능 발전 속도가 빠르지 않고, 2년 만에 병목에 도달한 것이냐는 우려다. 모델 성능 개선 곡선이 완만해지면 시장 기대가 붕괴될 수 있다. 성능이 정체된다면 AI 사용 비용에 대한 접근법을 바꿔야 할 수 있다. AI 기업이 수익을 위해 비용을 높이면, 그동안의 저렴한 토큰 비용에 맞춰 인력을 줄이고, 지출을 관리해온 조직은 급격한 비용 압박에 직면할 수 있다. AI 의존도가 높을수록 그 충격파는 더 커진다.

인프라 공급은 AI 사업자의 서비스 품질, 비용 구조, 고객 유지 등 다방면에 영향을 미치고 있다. 막대한 자본이 인프라에 흘러들고 있는 상황에서 프론티어 모델 사업의 토큰 비용 인상은 당분간 이어질 것으로 보인다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network

일간 바이라인 구독하기

첫 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.