오픈AI, 이미지 보고 추론하는 AI 모델 ‘o3’, ‘o4 미니’ 출시

오픈AI가 신형 추론 모델 ‘o3’와 ‘o4 미니’를 16일(현지시각) 출시했다. 회사는 두 모델이 사용자가 업로드한 그림, 그래프, 도표 같은 이미지를 이해하고 추론 과정에 반영한다고 밝혔다.

오픈AI는 o3가 자사 모델 중 수학, 코딩, 추론, 과학, 시각 정보 인식 등의 분야에서 성능이 가장 높은 추론 모델이라고 설명했다. 이미지, 차트, 그래픽 분석 같은 시각적 작업에 유리하며 코딩, 비즈니스 컨설팅, 창의적 아이디어가 필요한 분야에서도 탁월한 성능을 보인다고 언급했다. 또한 복잡한 작업에서의 오류가 20% 줄었다며, 다면 분석이 필요하고 명확한 답이 즉시 나오지 않는 복잡한 질문에 적합한 모델이라고 덧붙였다.

소형 모델인 o4 미니는 처리 속도와 가성비를 중시한 모델이다. 수학, 코딩, 시각 작업에서 비용 대비 높은 성능을 발휘하며, 데이터 과학 같은 비STEM 분야에서도 이전 소형 모델 ‘o3 미니’를 능가한다. 오픈AI는 “대형 모델을 사용하기 어려운 환경에서 추론 능력이 필요할 때 유용하다”고 말했다.

o3와 o4 미니는 이미지를 인식하는 단계를 넘어 이미지를 보고 추론하는 단계에 이르렀다. 사용자가 업로드한 화이트보드 사진, 교과서, 스케치 등을 인식할 수 있으며 흐릿하거나 뒤집어진 이미지도 해석 가능하다. 필요에 따라서는 사용자가 업로드한 이미지를 회전·변형해 문제를 해결한다. 사용자가 해결하고 싶은 문제나 오류를 텍스트 대신 스크린샷으로 업로드해도 내용을 분석해 적절한 답변을 제시한다.

오픈AI가 공개한 성능 비교 자료에 따르면 o3와 o4 미니는 AIME, 코드포스 등 다수의 성능 테스트에서 o1 모델보다 높은 점수를 기록했다. 회사는 두 모델이 MMMU를 비롯한 모든 멀티모달 성능 테스트에서 기존 모델(GPT-4o, o1)보다 높은 성능을 보였다고 언급했다.

오픈AI는 두 모델이 이미지로 추론하는 과정에서 지나치게 추론 시간이 길어지거나, 시각적 오류로 인해 잘못된 결과가 나오거나, 문제를 여러 번 푸는 과정에서 서로 다른 추론 방법을 시도하다 잘못된 결과를 낼 수 있다며 주의를 당부했다. 회사는 “이미지 활용 모델의 추론 기능을 더 간소화하고 중복을 줄이며 신뢰할 수 있는 답변을 내도록 지속적으로 개선하겠다”고 말했다.

o3와 o4 미니는 챗GPT 유료 사용자에게 제공된다. 챗GPT 플러스, 프로, 팀 사용자는 오늘부터 바로 사용할 수 있다. o3는 기존 o1 모델을, o4 미니는 o3 미니 모델을 대체한다. 챗GPT 엔터프라이즈와 에듀 사용자는 일주일 뒤 사용할 수 있다. 무료 사용자의 경우 프롬프트 입력기에서 o4 미니를 체험해 볼 수 있다.

오픈AI는 몇 주 안에 o3의 답변 정확도를 향상시킨 ‘o3 프로’ 모델을 챗GPT 프로 가입자 대상으로 출시할 예정이라고 밝혔다. 이는 오픈AI의 마지막 추론 전용 모델이 될 것으로 보인다. 오픈AI 최고경영자(CEO) 샘 올트먼은 지난 2월 자신의 X에 “향후 출시할 GPT-5 모델부터 일반 AI 모델과 추론 AI 모델을 통합할 것”이라고 공지한 바 있다.

글. 바이라인네트워크
<이병찬 기자>bqudcks@byline.network

답글 남기기 응답 취소