“코딩 성능 높였다” 오픈AI, 새 AI 모델 ‘GPT-4.1’ 3종 출시

오픈AI가 개발자용 인공지능(AI) 모델 ‘GPT-4.1’을 출시했다. GPT-4.1은 파라미터 규모에 따라 ▲GPT-4.1 ▲GPT-4.1 미니 ▲GPT-4.1 나노 3종류로 나뉜다. 오픈AI 모델에 미니보다 규모가 작은 ‘나노’ 버전이 출시된 건 이번이 처음이다.

오픈AI는 GPT-4.1의 코딩 성능이 크게 향상됐다고 주장했다. 코딩 성능을 측정하는 SWE 벤치마크에서 GPT-4.1의 점수는 54.6%로 GPT-4o보다 21.4%, GPT-4.5보다 26.6% 높다.

회사는 GPT-4.1에서 지시 수행 능력과 긴 글의 맥락을 이해하는 성능도 개선했다고 언급했다. 복잡한 문제 해결 능력을 측정하는 멀티챌린지 벤치마크 점수는 38.3%로 GPT-4o보다 10.5% 높다. 영상 이해 능력을 측정하는 비디오-MME 벤치마크에서 무자막 장편 영상 해석 성능 기준 GPT-4.1의 점수는 72.0%로 GPT-4o보다 6.7% 높은 성능을 기록했다.

오픈AI는 “GPT-4.1 시리즈는 더 저렴한 비용으로 탁월한 성능을 제공한다”며 “GPT-4.1 미니는 소형 모델 성능 평가에서 GPT-4o와 동등하거나 능가하는 성능을 보이며 지연 시간은 절반, 비용은 83% 줄었다”고 소개했다. 이어 “GPT-4.1 나노는 분류 작업이나 자동완성처럼 낮은 지연 시간이 필요한 작업에 적합하다”고 덧붙였다.

GPT-4.1 출시로 오픈AI는 경쟁사 대비 코딩 성능이 뒤떨어진다는 인식을 뒤집을 기회가 생겼다. 구글이 지난달 공개한 제미나이 2.5 프로는 100만토큰 콘텍스트 창을 지원한다. 한 번에 기억하고 이해하는 단어 수가 약 75만개에 달해 긴 문서를 처리하거나 대규모 코드를 분석하기 용이하다. 반면 GPT-4o는 8분의 1 수준인 12만8000토큰 콘텍스트 창을 지원해 성능면에서 뒤처진다는 평가를 받았다. 그러나 이번에 출시한 GPT-4.1은 100만토큰 콘텍스트 창을 지원하면서 경쟁사 최신 모델과 어깨를 나란히 했다.

오픈AI는 2월 마지막 비추론형(Non-Chain-of-Thought) 모델 ‘GPT-4.5’ 프리뷰 버전을 출시한 바 있다. 회사는 GPT-4.1 출시 후에도 챗GPT를 통해 GPT-4.5 프리뷰 버전을 계속 제공한다. 단, GPT-4.5 애플리케이션 프로그래밍 인터페이스(API) 지원은 오는 7월 14일 중단할 예정이다. 오픈AI는 GPT-4.1이 훨씬 낮은 비용과 지연 시간으로 한층 개선된 성능을 제공하기 때문이라고 설명했다. 반면 GPT-4.1은 API로만 제공한다. 따라서 챗GPT에서는 GPT-4.1 모델을 이용할 수 없다.

글. 바이라인네트워크
<이병찬 기자>bqudcks@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다