“라이너 AI 검색 LLM, GPT-4.1 대비 우수”

‘라이너 검색 LLM’ 평가 결과 공개
컴포넌트 기반 자체 검색 LLM 개발
8가지 컴포넌트 GPT-4.1 대비 성능 우수
학술·연구 리서치 최적화로 글로벌 공략

글로벌 AI 검색 스타트업 라이너(Liner, 대표 김진우)는 ‘라이너 검색 LLM(Search Large Language Model)’이 AI 검색 답변 생성에 사용되는 핵심 컴포넌트 평가에서 오픈AI의 GPT-4.1 모델보다 우수한 결과를 기록했다고 3일 밝혔다.

라이너 검색 LLM은 사용자 질문을 분석하고 처리하는 데 필요한 8가지 핵심 컴포넌트를 통합해 자체 개발한 모델이다. 각 컴포넌트는 오픈 소스 모델을 기반으로, 10여 년간 축적해 온 라이너의 사용자 데이터를 사후 학습(Post-training)해 정밀하게 설계됐다.

[무료 웨비나] 아이덴티티 보안 없는 보안 전략은 더 이상 안전할 수 없습니다

◎ 일시 : 2025년 7월 15일 (화) 14:00 ~ 15:30
◎ 장소 : https://bylineplus.com/archives/webinar/53537

라이너는 동일한 태스크(Task)를 기준으로 체계적인 내부 검증 프로세스를 통해 오픈AI의 GPT-4.1과 성능(정확도), 처리 속도, 비용(토큰당 가격)을 비교 분석했다. 특히 실제 서비스 환경에서 결과의 재현성과 신뢰성을 확보하며, 세 가지 요소를 객관적으로 평가하는 데 주력했다

그 결과 ▲카테고리 분류(Category_Classification) ▲과제 분류(Classify_Homework) ▲외부 도구 실행(Execute_Task_with_External_Tools) ▲중간 답변 생성(Create_Intermediate_Answer) 4개 핵심 컴포넌트에서는 성능·속도·비용 모든 측면에서 GPT 4.1을 능가하는 결과가 나왔다. 또한 ▲질문 분해 여부 판단(Decide_Query_Decomposability) ▲필요 문서 식별(Extract_Necessary_Document_Ids) ▲출처 포함 중간 답변 생성(Create_Intermediate_Answer_with_Reference) ▲할 일 관리(Todo_Maker) 4개 컴포넌트에서도 두 가지 이상의 항목에서 경쟁 우위를 기록했다.

라이너는 수많은 테스트를 거치며 LLM 학습 방법론을 지속적으로 고도화해 왔다. 이를 통해 라이너 검색 LLM은 문제를 유연하게 해결하고 정확한 답을 도출하는 데 특화될 수 있었다. 또한 토큰당 처리 비용이 GPT-4.1 대비 평균 30~50% 낮아, 대규모 트래픽 환경에서도 높은 운영 효율성과 수익성을 확보할 수 있는 경쟁력을 갖추게 됐다.

조현석 라이너 테크 리드는 “라이너 검색 LLM은 8가지 모든 컴포넌트에서 GPT를 뛰어넘는 성능을 입증했다”라며 “어떤 데이터를 어떻게 학습하고, 어떤 구조로 질문을 처리하느냐가 AI 할루시네이션을 줄이는 핵심”이라고 말했다. 이어 “데이터 학습과 연구 개발에 꾸준히 집중해 온 노력이 차별화된 AI 에이전트 기술 경쟁력으로 이어졌다는 점에서 의미가 크다. 앞으로도 리서치에 최적화된 정확한 검색 경험을 제공하며, 글로벌 시장을 적극적으로 공략해 나가겠다”라는 포부를 밝혔다.

글. 바이라인네트워크
<이대호 기자>ldhdd@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.