(출처=오픈라우터 블로그)

오픈라우터, 멀티 AI 모델 병렬 실행 도구 ‘퓨전’ 출시

조직의 효율적인 멀티 AI 모델 채택을 지원하는 ‘오픈라우터’는 여러 모델을 병렬로 실행하는 도구 ‘퓨전(Fusion)’을 지난 12일 출시했다. 오픈라우터 측은 이를 통해 클로드 페이블5을 단독으로 사용하는 것보다 비용을 크게 절감하면서 더 나은 성능을 경험할 수 있다고 설명했다.

오픈라우터는 다양한 AI 모델의 API를 하나로 통합해 사용하게 해주는 플랫폼이다. 사용자의 프롬프트에 따라 최적의 모델 API를 호출해 사용할 수 있게 한다.

새롭게 공개된 퓨전은 웹 검색 및 가져오기 기능을 활성화한 여러 AI 모델에게 같은 질문을 동시에 던져 결과를 종합해 답변을 만드는 기능인 ‘패널(panel)’을 제공한다.

내부의 DRACO 벤치마크 테스트 결과 다양한 모델의 패널 조합이 단독 모델을 사용했을 때보다 더 높은 점수를 보였다. 클로드 페이블5와 GPT-5.5를 결합한 모델이 69.0%를 기록해 페이블5 단독으로 사용했을 때의 65.3%보다 높은 벤치마크 점수를 보였다. 제미나이3 플래시, 키미 K 2.6, 딥시크 V4 프로 등으로 조합된 보급형 패널의 경우 50%의 비용으로 GPT-5.5와 오푸스4.8을 소폭 우회하는 성능을 보였다.

오픈라우터 퓨전의 DRACO 벤치마크 결과의 비용 대비 성능(출처=오픈라우터 블로그)

DRACO 벤치마크는 퍼플렉시티에서 공개한 딥리서치 평가다. AI 에이전트가 복잡한 질문을 분석하고, 여러 차례 웹을 검색하며, 자료를 수집해 상충 정보를 비교해 긴 보고서를 작성하는 능력을 측정한다.

퓨전의 패널 기능은 여러 모델을 병렬로 호출하고 각 모델의 모든 응답에 구조화된 분석을 생성한다. 합의점, 모순점, 부분적 범위, 독창적 통찰력, 사각지대 등을 분석한 뒤 그를 기반으로 최종 답변을 작성한다. 전체 파이프라인은 서버 측에서 실행된다.

오픈라우터는 서로 다른 모델을 합성하는 것뿐 아니라 오푸스4.8을 별도의 패널로 구성해 오푸스4.8로 합성하는 테스트도 진행했는데, 오푸스4.8 단독 실행보다 더 향상된 점수를 보였다고 밝혔다. 서로 다른 모델 아키텍처를 결합하는 것뿐 아니라 합성 단계 자체에서 성능 향상이 이뤄지는 것이라고 설명했다.

최근 AI 모델 서비스의 토큰 비용 급증에 따라 워크로드 시나리오에 맞게 다양한 AI 모델을 혼용하는 방법이 주목받고 있다. 오픈라우터는 복잡한 작업을 수행하는 AI 에이전트의 정확도를 높이고, 편향이나 실수를 보완할 수 있어 널리 확산되고 있다. 오픈라우터터는 올해초 일주일 간 13조 토큰을 처리하는 것으로 알려졌다. 지난 5월 1130만달러 규모의 투자를 유치해 기업가치 13억달러를 기록했다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network

일간 바이라인 구독하기

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.