에릭 징 젠스파크 CEO(출처=젠스파크 미디어투어 한국기자단)
|

말만 해도 PPT 잘 뽑아주는 에이전트 ‘젠스파크’의 비결

“오픈AI, 앤트로픽 같은 선도적인 AI 모델 회사는 포뮬러원 스포츠카를 만듭니다. 일반인에게 포뮬러원이 필요한 건 아닙니다. 그런 차를 유지하려면 정확한 지식을 갖춘 전문가 그룹이 필요하고, 매일 운전하기에 불편하니까요. 젠스파크는 일반적인 지식 근로자를 위한 현대차, 토요타 같은 경제적인 자동차를 만듭니다. 지금은 모델의 성능을 주로 이야기 하지만, 일반인은 머지 않아 그런 것에 관심을 갖지 않고 완벽한 호환성을 더 따지게 될 겁니다. 중요한 건 사람의 기억과 맥락을 바탕으로 모든 것을 구축하고 생성해 줄 수 있는 AI 서비스입니다.”

에릭 징 젠스파크 공동창업자 겸 최고경영자(CEO)는 23일 미국 팔로알토 본사에서 열린 한국 및 일본 미디어 대상 브리핑에서 자사의 AI 서비스에 대해 이같이 밝혔다.

에릭 징 CEO는 “지금 우린 고통스러운 AI 혁명의 과도기에 있다”며 “지금은 10% 정도 진행된 단계로 아직 90%의 혁명적 가능성이 남아있다”고 말했다.

그는 “오늘날 모델 회사는 초강력 엔진을 개발하지만, 일반 근로자가 가장 비싸고 최신의 모델만 사용하는 건 아니다”라며 “젠스파크는 고객에게 가장 적합한 엔진을 선택하고, 누구나 쉽게 배우고 사용할 수 있는 제품으로 번역해주는 기술 번역가”라고 설명했다.

그는 “프론티어 연구소가 원시적인 기술을 구축하면, 이를 활용 가능하게 만들어 사용자에게 완성된 결과물을 제공하는 게 젠스파크의 역할”이라며 “우리는 최첨단 기술을 모든 사람의 손에 쥐어준다”고 강조했다.

“사용자에게 필요한 건 AI 지식보다 진짜 에이전트”

젠스파크는 다양한 생성형 AI 모델을 기반으로 지식 근로자의 일상 업무를 지원하는 에이전트형 AI 서비스를 제공한다. 오픈AI, 앤트로픽 등 프론티어 모델과, 오픈 모델을 포함해 70개 이상의 AI 모델과 150개 이상의 도구, 20개 이상의 데이터셋 등을 통합해 일반 사용자가 자연어 프롬프트만으로 완성된 프리젠테이션, 스프레드시트, 문서 등을 만들어 준다.

에릭 징 CEO는 2022년 11월 오픈AI 챗GPT 출시 후 2023년까지를 챗봇의 시기로, 2024년부터 작년까지를 코파일럿의 시기로 정리했다. 그리고 올해를 ‘자율형 에이전트’ 시기의 시작으로 규정했다. 챗GPT 등장 후 3년만에 생성형 AI 세계의 성격이 순식간에 변화, 진화하고 있는 것이다. 그러나 기술의 발전 속도와 일반 사용자의 적응 속도는 큰 격차를 보인다. 이제 매주 새로운 첨단 AI 모델이 경쟁적으로 출시되고 있지만, 일반 사용자가 일주일마다 새로운 AI 모델을 공부하고, 적극적으로 사용하며 우열을 가리진 않는다.

그는 “전세계 인구의 대부분이 여전히 챗봇을 사용하는 단계에 머물러 있다”며 “일부 개발자가 코파일럿을 사용하고 있지만, 이는 기존 동작을 변경하지 않고 기존 도구 세트를 그대로 유지하는 형태”라고 설명했다.

그는 “곧 자율형 에이전트가 현실화되면, 에이전트가 모든 계획을 스스로 세우고 실행하며 평가하고, 최종적으로 테스트까지 완료할 수 있게 된다”며 “클로드코드, 코덱스 등의 코딩 에이전트가 자율 에이전트의 1세대에 속하고, 젠스파크도 그 1세대에 포함된다”고 말했다.

젠스파크의 제품은 3단계의 처리 구조를 따른다. 컨텍스트를 모으고, 정보를 처리하며, 비즈니스 결과물을 생성한다. 젠스파크의 ‘AI 워크스페이스 4.0’ 제품군은 AI 슬라이드, AI 시트, AI 독스 등의 오피스 기능과, 구글워크스페이스 플러그인, 마이크로소프트365 플러그인 등의 외부 플러그인을 제공한다. 또한, AI 챗, AI 이미지, AI 비디오, AI 오디오, AI 뮤직, 클립 지니어스, AI 팟, 딥리서치, 팩트체크, 번역, 콜포미, 다운로드포미, 인박스, 드라이브 등의 확장 기능도 제공한다.

젠스파크는 최첨단 모델 기반과 사용자 사이의 에이전틱 레이어인 ‘젠스파크 에이전트 엔진’, 업무 에이전트 등을 제공하는데 집중한다. 젠스파크는 에이전트 사용자를 대신해 세계의 최신 AI 모델을 검증하고 평가하며, 젠스파크 에이전트 엔진으로 각 작업에 가장 적합한 모델과 도구를 자동 선택해 기능을 구동한다. 주요 제공 모델에 GPT-5.5 및 o-시리즈, 클로드 오푸스·소넷·하이쿠, 제미나이3 프로·플래시·나노바나나, 그록, 딥시크, 큐원, 키미(Kimi), GLM-5.2, 미니맥스 등을 포함한다.

젠스파크는 2023년 12월 설립된 신생 스타트업이다. 2년 반밖에 되지 않았지만, 실리콘밸리에서 가장 빠르게 성장하는 AI 기업 중 하나로 꼽힌다. 2차례의 투자금 유치를 거쳐 기업가치 26억달러를 기록했다. 신생기업이지만, 연간반복매출(ARR)이 2.5억달러에 이른다. 주요 투자자로 이머전스캐피털, 랜치벤처스, SBI인베스트먼트, LG 테크벤처스, 파빌리온캐피탈 등이 있다.

젠스파크는 현재 미국을 비롯해, 일본, 한국, 싱가포르 등에서 사업을 영위하고 있다. 인도, 브라질, 사우디아라비아, 프랑스 등으로 글로벌 확장을 진행중이다. 한국 지사는 4월 첫 현지 직원을 채용하며 본격적인 한국 내 사업을 시작했다.

젠스파크는 오픈AI, 앤트로픽, 마이크로소프트 등의 핵심 AI 파트너로 언급된다. 오픈AI는 젠스파크를 45일만에 3600만달러 ARR을 기록한 사례로 소개한다. 앤트로픽은 클로드 고객사례에서 젠스파크의 ‘슈퍼 에이전트’를 150개 이상의 전문 도구를 오케스트레이션한 사례로 들며, 주요 마케팅에서 강조한다. 마이크로소프트와도 긴밀히 협력하며, 마이크로소프트365 및 에이전트365 생태계 내에서 수십억명 규모의 사용자 접점을 확보할 수 있는 전략적 파트너로 소개한다. 일본 현지에서 젠스파크 서비스는 마이크로소프트 애저 일본 리전에서 서비스되고 있다.

젠스파크의 공동창업자는 주로 중국계다. CEO인 에릭 징은 마이크로소프트에 2006년 입사해 빙 검색 개발 부문에서 근무했으며 당시에 사업부장이었던 사티아 나델라와 일했다. 바이두에서 웹 검색, 음성 및 이미지 기반 멀티모달 검색, AI 제품 혁신을 주도했다. 현재 젠스파크에서 회사 비전, 사업 전략, 글로벌 시장 포지셔닝 등을 주도하고 있다.

최고기술책임자(CTO)를 맡은 케이 주는 구글에서 AI 기반 검색 랭킹 기술 엔지니어로 근무했고, 상용 검색 환경의 딥러닝 랭킹 모델을 개발한 경험을 가졌다. 바이두에서 검색 최고 아키텍트를 지내기도 했다. 현재 젠스파크의 슈퍼에이전트와 멀티에이전트 아키텍처를 주도하고 있다.

최고 아키텍트를 맡은 지아카이 저스틴 리우는 구글 차이나에서 시니어 소프트웨어 엔지니어로 근무했고, 페이스북 메시지의 백엔드팀 창립멤버로서 메신저 인프라 구축과 사용자 규모 확장에 관여했다. 바이두에서 LLM 배포와 최적화 중심의 AI 인퍼런스팀을 설립하고 리드를 맡았다. 현재 젠스파크의 AI 워크스페이스와 에이전트 엔진 아키텍처를 주도하고 있다.

엔터프라이즈 공략 조직인 ‘GTM팀’을 이끌고 있는 렌조이 린은 구글에서 웹 검색, 디스플레이 및 유튜브 광고 등의 시스템에 참여했다. 핀터레스트에서 홈피드 광고 및 광고 타겟팅, 광고 마켓플레이스 시스템 구축 경험을 쌓았고, 틱톡의 바이트댄스에서 광고 성과 측정, 타겟팅 및 고객 솔루션 엔지니어링 조직을 설립하는데 기여했다.

창업자들의 경력을 보면 검색 기술과 머신러닝에서 주요 경험을 쌓은 것을 알 수 있다. 에릭 징 CEO는 “젠스파크는 70여명의 소규모 조직이지만 검색부터 AI, 소프트웨어, 기타 엔터프라이즈 서비스 등 매우 다양한 분야의 경험을 보유했다”고 말했다.

그는 “젠스파크는 10억명의 지식 근로자에 집중하며 보안, 개인정보 보호, 데이터 프라이버시, 기존 업무 환경과 통합에 관심을 기울여 지식 근로자를 위한 제품을 개발해왔다”며 “제품의 시작은 AI 검색 엔진이었고, 앤트로픽의 클로드3.7 후 AI가 자유롭게 도구를 선택해 활용하고 결과를 생성하게 되면서 슈퍼에이전트를 선보였다”고 말했다.

사용자의 의도에 맞는 정확한 검색을 개발한 경험은 AI 모델을 위한 컨텍스트를 모아 실제 비즈니스 의도에 맞춰 정보를 처리하는 젠스파크의 제품 역량에서 중요한 기반이다. 젠스파크의 슈퍼에이전트는 프롬프트에 맞게 쿼리를 실행해 결과를 얻고 도구를 호출해 결과를 생성한다.

에릭 징 CEO는 “AI 워크스페이스는 정보 검색뿐 아니라 업무에 필요한 모든 시나리오를 포괄하려 한다”며 “채팅, 전화통화, 이메일, 회의 등에서 콘텐츠와 정보를 모으며, 최첨단 모델을 활용하는 완전한 에이전트 레이어를 구축하고 있다”고 말했다.

그는 오늘날 AI 모델의 발전이 너무 빠른 속도로 진행되고 있다는 점에 주목한다. 그는 “매주 새로운 모델이 출시되며 엄청난 양의 작업이 쏟아지고 있지만, 일반적인 지식 수준으로 이 모든 새로운 모델을 추적하거나 최신 모델을 파악하는 데 충분한 시간과 역량을 확보하기 어렵다”고 말했다.

그는 “우리가 고객을 대신해 모델을 선택해주는 계층을 만들어 에이전트 레이어의 역할을 제공한다”며 “이 에이전트 레이어는 최적의 모델을 선택하고, 마이크로소프트 인프라에 코드를 작성하며, 사용자 요구에 맞는 적절한 컨테이너와 아키텍처를 사용하는 엔지니어링 레이어”라고 설명했다.

젠스파크는 우리나라에서 자연어 프롬프트로 유려한 파워포인트 슬라이드를 만들 수 있다는 점으로 입소문을 탔다. 그러나 사실 대부분의 사무 작업에서 요구되는 콘텐츠 생성을 지원한다. 사무직의 프리젠테이션 뿐 아니라 스프레드시트와 일반 업무 문서도 잘 만들어줄 뿐 아니라, 웹사이트 대시보드를 구축하는 ‘코드’, 나노바나나2 같은 모델로 이미지를 생성하는 ‘AI 이미지’, 음악을 만들어주는 ‘AI 뮤직’, 다양한 언어로 진행되는 회의의 번역을 제공하는 ‘스피클리’ 등 다양한 라인업을 갖췄다.

이에 대해 에릭 징 CEO는 “우리는 젠스파크를 AI 코스트코라 부르며, 고객에게 가장 적합한 제품을 선별해 드린다”며 “하나의 구독으로 모든 작업 패턴과 모델에 접근할 수 있다”고 말했다.

그는 간담회에서 실제 AI 워크스페이스의 주요 기능들을 실제 작동을 시연했다. 스페이스X의 비즈니스를 분석하라는 프롬프트에 젠스파크는 스스로 딥리서치를 수행하고, 이를 바탕으로 여러장의 프리젠테이션 문서를 생성했다. 직접 이미지를 생성해 디자인하거나 공개된 이미지를 가져다 삽입하기도 했다. 영어로 작성된 문서는 간단한 입력으로 한국어나 일본어 버전으로 재생성됐다. AI 시트에 대한 또 다른 시연에서 삼성전자의 5년치 공시 및 재무보고서를 분석해달라는 지시에 정보를 찾아 스프레드시트 테이블에 데이터를 입력하고, 분석해 차트도 만들었다. 테이블 내 계산 결과를 담아야 하는 필드의 경우 단순히 숫자나 텍스트가 아닌 실제 함수로 입력됐다. 또한, 모든 문서의 데이터는 서로 연결돼 정보 업데이트를 도구 전환없이 알아서 처리했다. 또 다른 시연에서 간담회를 주제로 영어와 한국어로 된 힙합 노래를 즉석에서 다양한 버전으로 만들기도 했다.

그는 “젠스파크 플랫폼에서 사용자는 AI의 새로운 기능에 전혀 신경쓰지 않아도 된다”며 “사용자그룹 설문조사에서 많은 사람이 AI를 두려워하고 학습하길 두려워한다는 걸 발견했는데, AI가 너무 빠르게 발전하고 있고, 새로운 기능이 너무 많다고 생각하기 때문이며, 그들은 사용하기 쉬운 플랫폼을 원한다”고 밝혔다.

그는 “간단한 인터페이스로 다양한 AI 모델에 접근하고, 그것을 조합해 최적의 모델과 도구를 선택할 수 있으면 원하는 것을 설명하기만 하는 것으로 끝날 수 있다”고 덧붙였다.

그는 “기술 업계 종사자뿐 아니라 평범한 사람들, 지식 근로자가 최첨단 도구를 사용해 업무를 쉽게 처리할 수 있는 AI를 개발하는 기업이고 싶다”고 강조했다.

최신 모델 자율 평가와 자가 개선 역량

케이 주 젠스파크 CTO는 젠스파크의 기술적 기반에 대해 설명했다. 그는 젠스파크 플랫폼의 핵심을 모델 라우팅, 자율 모델 평가 파이프라인 등으로 꼽았다.

그는 “기술적 관점에서 오늘날 모든 모델은 이미 훌륭하며, 현재 주요 제공업체의 다양한 상위 모델을 사용하는 단순 채팅 인터페이스에서 일반 사용자는 모델 간의 차이를 실제로 구분하기 어려울 정도의 수준에 이르렀다”며 “곧 수일 내에 오픈AI에서 GPT-5.6이 출시될 예정이고, 앤트로픽에서 클로드 오푸스의 다음 버전도 곧 나올 것인데 일반 사용자는 모델 간의 차이를 제대로 구분하지 못할 것”이라고 말했다.

그는 “바로 이 부분에서 젠스파크가 도움을 주기 위해 개발됐다”며 “젠스파크는 모델을 선별하고, 사용자의 작업에 가장 적합한 모델을 선택해준다”고 말했다.

케이 주 젠스파크 CTO(출처=젠스파크 미디어투어 한국기자단)

AI 모델이 출시될 때마다 순위를 뒤집는 현상은 일견 모델의 상향 평준화를 의미하기도 한다. 한달 안에 1위 모델이 교체되는 상황에서 성능의 우위를 스스로 판단하는 건 무의미하다고 볼 수 있다. 모델마다 강점인 영역이 있으므로 사용 목적에 따라 평가하고 선택하는 게 필요한데, 사용자 스스로 하기 힘들다. 최고급 모델의 경우 비용이 더 비싸 쓸데없이 과도한 비용을 지불할 수도 있다. 최근 AI 에이전트를 운영하게 되면서 AI 모델의 토큰 사용량이 급증하고, 기본적인 AI 모델 사용료가 증가하므로 적절한 모델을 혼합 사용하는 게 추천된다.

젠스파크는 사용자의 작업 유형에 따라 가장 적절한 모델을 매칭해 토큰 비용 절감과 최적 성능을 동시에 잡을 수 있다고 강조한다. 케이 주 CTO는“각 모델은 특정 작업에 강점을 갖고 있고, 일례로 GPT 모델은 글쓰기에, 클로드는 코딩에, 제미나이는 이미지나 비디오에 적합하다”며 “대부분의 사용자는 복잡한 작업을 수행하지 않으므로, 비싼 모델을 반드시 써야 하는 게 아니다”라고 말했다.

그는 “젠스파크는 자체적인 자율 평가 파이프라인을 통해 모든 새 모델을 평가하고, 구축 비용이 가장 저렴한 모델을 선택한다”며 “사용자는 모델의 상황을 일일이 확인하지 않아도 된다”고 설명했다.

젠스파크는 다양한 워크스페이스에 대해 여러 최적 도구를 통합한 에이전트 하네스를 활용한다. 케이 주 CTO는 “다양한 워크스페이스가 있고, 각 워크스페이스에서 여러 가지 작업을 수행할 수 있다”며 “슬라이드 생성, 교대 근무표 생성, 비디오 생성 등 작업에 맞는 워크스페이스를 지정하면 필요한 도구와 모델을 통합해 원하는 결과물을 생성하게 도와준다”고 밝혔다.

그는 “사용자의 프롬프트에 젠스파크의 에이전트 엔진은 먼저 최적 모델을 라우팅하고, 모든 시나리오에 맞는 워크스페이스도 제공하며, 무엇보다 인텔리전스 자체가 진화한다”며 “만약 사용자가 소리를 생성하는 모델을 사용했는데 만족스럽지 못했다면, 젠스파크는 이를 기억하고 다음에 사용할 때 같은 오류를 반복하지 않도록 한다”고 강조했다.

그는 기술적으로 사용자마다 모델의 역량을 활용하는 수준에 격차가 있다고 했다. 에릭 징 CEO의 말을 뒷받침하는 데이터를 제시했다.

그는 “대다수의 사용자는 챗GPT나 제미나이를 AI 검색의 빠른 버전이라고 생각하고 날씨나 월드컵 상품 정보 검색에  활용하는 데 그친다”며 “모델의 잠재력은 이미 존재하지만, 대부분은 최첨단 모델의 진정한 잠재력을 제대로 활용하지 못하고 있는 것”이라고 말했다.

그는 “전세계 인구 중 클로드코드나 코덱스 같은 기술을 사용해본 사용자는 0.04%에 불과하며, 99.96%는 모델의 최첨단 기능을 활용하지 못하고 있다”며 “젠스파크의 가치는 바로 이 격차를 메우는 것으로, 일반 사무직 근로자가 AI 연구소의 모델에 대해 알 필요도 없고, 매주 모델 개발 상황을 추적할 필요도 없도록 누구나 쉽게 사용할 수 있게 제공한다”고 강조했다.

글. 바이라인네트워크
<팔로알토(미국)=김우용 기자>yong2@byline.network

일간 바이라인 구독하기

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.