“당장 활용가능한 AI 모델, 합성데이터, 그리고 에이전트”
[인터뷰] 우도 스글라보 SAS 응용 AI 및 모델링 R&D 부문 부사장(VP)
“SAS의 AI 전략은 에이전틱 AI다. 기본적으로 SAS의 AI 에이전트 전략은 3가지 기둥을 갖는다. 첫째는 바이야 플랫폼의 구성요소로서 AI 에이전트이고, 두번째는 고객이 SAS 바이야 플랫폼을 활용해 자체 에이전트를 구축할 수 있도록 하는 것이다. 세번째는 독립적인 에이전트다. 여기서 독립적이란 SAS 바이야를 실행할 필요가 없다는 의미다. SAS 에이전트는 기본적으로 멀티 에이전트 환경에서 작동하도록 설계됐으며, MCP를 활용하고, 여러 에이전트는 A2A 프로토콜로 서로 대화할 수 있다.”
우도 스글라보 SAS 응용 AI 및 모델링 부문 부사장(VP)은 7일 미국 올랜도에서 <바이라인네트워크>와 인터뷰에서 자사의 AI 에이전트 전략에 대해 이같이 밝혔다.
SAS는 기업 내 개발자, 데이터 과학자 및 분석가, 비즈니스 리더에 이르기까지 조직 내 전체 구성원이 손쉽게 데이터를 활용하게 하는 걸 목표로 한다. 사용자는 SAS 바이야 기반으로 생성형 AI를 도입함으로써 생산성을 높이고 더 나은 의사결정을 할 수 있게 된다. 이와 함꼐 기업과 조직이 각자의 산업 특성과 목적에 맞게 AI 모델을 쉽게 도입하고, 즉시 활용해 효과를 볼 수 있게 하는 경량 모델도 제공하고 있다. SAS AI 모델은 각 산업 특성과 업무에 맞도록 만들어졌고, 특정 시나리오에서 일반 기반 모델보다 더 빠른 성능과 더 적은 비용으로 투자효과를 달성하도록 한다.
현재 활용가능한 AI 모델은 전 산업에 대한 AI 기반 개체 식별, 문서 분석 등과, 헬스케어의 약물 복용 순응 위험, 제조의 전략적 공급망 최적화, 공공 부문의 식량지원을 위한 지불 성실성 및 매출에 대한 세무 준수 등이다. SAS는 올해 은행업을 위한 결제 및 카드 모델에 대한 사기 판별, 헬스케어를 위한 의료 서비스용 지불 무결성, 제조업의 근로자 안전 모니터링, 공공부문의 개인 소득세 세무 준수 등의 경량 모델을 출시할 예정이다.
이와 함께 기업과 조직 내 다양한 데이터 소스를 SAS 모델과 제품에 맞게 자동 변환하는 ‘데이터 매퍼 에이전트’를 올해 ‘SAS 이노베이트 2025’에서 선보였다. 데이터 매퍼 AI 에이전트를 이용하면, 이기종 형식의 데이터에 대한 데이터 준비 작업을 자동화할 수 있고, AI 모델을 실시간으로 실행할 수 있게 된다.
SAS는 올해 컨퍼런스에서 디지털트윈과 AI의 결합에 대해서도 상당한 힘을 실었다. SAS의 특수 목적형 AI 모델과 에이전트는 디지털트윈에서도 새로운 가능성을 열어준다.
우도 스글라보 부사장은 “이제 디지털 트윈과 에이전트는 공생 관계를 맺었다”며 “디지털트윈은 기본적으로 전체 프레임워크를 모방하는 것이고, 에이전트는 디지털 트윈의 인텔리전스 역할을 한다”고 설명했다.
그는 “조지아퍼시픽에 제공한 디지털트윈에서 보듯 최적의 방식으로 얼마나 많은 차량이 공장 안에 필요한지 파악하고 싶어 할 때 에이전트가 ‘지금 운영 조사를 지원하겠습니다’라고 하면서 여러분의 데이터를 기반으로 최상의 시나리오를 결정하기 위해 고급 알고리즘을 적용하게 될 것”이라고 말했다.
SAS가 곧 출시할 데이터 매퍼 에이전트는 흥미롭다. 기업이 다양한 데이터를 수집하고 직접 분석하거나 AI 학습과 추론에 활용하기까지 가장 번거롭고 고통스러운 작업이 데이터의 준비와 공급이기 때문이다. 데이터 추출변환적재(ETL)은 데이터를 활용하려는 모든 기업에게 가장 큰 골칫거리다. 데이터 매퍼 에이전트는 데이터웨어하우스, 데이터레이크, 애플리케이션 등에 있는 파편화된 형식의 데이터를 AI 모델에게 학습 가능한 형식으로 변환해 제공한다.
스글라보 부사장은 “데이터 매퍼는 전통적인 ETL을 향상시킬 수 있을 것이라고 생각한다”며 “모든 것을 수동으로 수행하는 대신, 열 연결을 노코드 환경에서 에이전트의 도움을 받는 ETL 작업자를 위한 생산성 도구 역할을 하게 될 것”이라고 설명했다.
그는 “데이터 매퍼는 실제로 코드를 생성하고, 그 코드를 실행하는 시스템에 코드를 넣어야 하기 때문에 데이터를 물리적으로 이동할 수 있는 권한을 갖지 않는다”고 덧붙였다.
기업이 SAS에서 제공하는 사전 준비된 모델을 사용하면, 빠르게 ROI를 실현할 수 있다는 점뿐 아니라 AI 모델의 최신성을 유지하는 데도 유리하다. SAS는 다만, 고객에게 모델 업데이트를 강제하진 않는다.
스글라보 부사장은 “SAS는 모델의 새로운 버전을 지속적으로 출시하고, 결과를 기반으로 모델을 조정한다”며 “모델을 조정하기 위해 더 많은 데이터를 얻을 것이므로 기본적으로 모델에 대한 업데이트를 제공한 다음 고객이 해당 업데이트를 수행할지 여부를 결정할 수 있다”고 말했다.
그는 “예를 들어 사기 탐지를 위한 모델을 구축해 사기꾼을 감지할 때 영리한 사기꾼은 모델이 어떻게 작동하는지 알아내고 행동을 바꿀 것”이라며 “갑자기 모델이 더 이상 사기꾼의 행동을 감지하지 못하게 될 때 모델을 새로 고쳐야 할 것이고, 그때 고객에게 미리 준비된 새로운 버전을 규제를 준수하는 선에서 버튼 클릭으로 교체하게 한다”고 설명했다.
많은 회사가 AI에 상당한 투자를 하고 파일럿을 수행하고 있지만, 전사 확산이나 생산성향상 효과를 거두는 것에 어려움을 겪는다. 우도 스글라보 부사장은 ‘생성형 AI에 과도한 기대를 갖는 것’에서 원인을 찾았다.
그는 “일반적인 사람들이 생성형 AI 모델이 텍스트 데이터만을 위해 설계됐다는 것을 깨닫기 전까지 생성형 AI 모델에 대한 기대치가 너무 높았다”라며 “생성형 AI가 인상적인 기술이 아니라고 말하는 건 아니며, 소프트웨어와 진정으로 대화할 수 있는 첫 방법이란 점에선 인상적”이라고 말했다.
그는 “학습 데이터는 기본적으로 모델이 알 수 있는 우주를 정의하므로, 만약 여러분이 그 우주 밖에 있는 질문을 가지고 모델을 사용한다면 그 모델은 그것으로 무엇을 해야 할지 경험이 없기 때문에 환각을 일으킨다”며 “따라서 합성 데이터 생성은 응용 AI 관점에서 높은 수준의 학습, 성능 및 편향 완화에 안정적으로 사용될 수 있도록 만들 수 있다”고 밝혔다.
합성 데이터는 SAS에서 AI 모델의 성능을 높이는 방안으로 강력하게 밀고 있는 기술이다.
그는 “합성 데이터는 실제로 모델러의 손에 데이터 생성을 제어할 수 있는 방법”이라며” 모델을 구축하기 위해 기본적으로 실제 데이터를 사용해야 하지만 그것만으로 충분하지 않을 수 있으며 확보하기도 어려울 수 있다”고 말했다.
그는 “만약 작업자 안전을 위한 모델을 만들 때 그 학습 데이터는 실제 사망 사고 데이터여야 하지만, 미래에 사람의 죽음을 막는 모델을 만드려고 사람이 정말로 죽어야만 역사적인 데이터를 생성할 수 있는 상황”이라며 “사기 탐지 모델의 경우에도 실제로 사기 사건이 더욱 더 많아져야 만들어질 것이고, 그렇게 되면 많은 기업과 개인은 폐업과 파산을 하게 될 것”이라고 설명했다.
그는 “시뮬레이트된 데이터는 이제 모델러에게 공장 현장에 하루에 100건의 사고가 발생하는 것처럼 말할 수 있는 기회를 제공한다”며 “필요한 데이터를 구축한 다음, 타당하다면 이러한 사고를 감지하는 방법을 알아낼 모델을 구축하면 되므로, 실제 데이터보다 더 윤리적이며, 완전히 통제할 수 있는 데이터인 것”이라고 덧붙였다.
글. 바이라인네트워크
<올랜도(미국)=김우용 기자>yong2@byline.network