스노우플레이크, ‘AI 레디 데이터’ 걱정 덜어준다
대형언어모델(LLM)이 기업 내 정형 데이터를 이해하려면 비즈니스 컨텍스트와 매핑을 알아야 한다. 데이터 속 비즈니스 맥락을 설명하는 ‘시맨틱 계층’을 구축해야 LLM이 기업 사용자의 의도에 맞는 정확한 답을 해줄 수 있다. 그러나 시맨틱 계층을 일일이 수작업으로 입력하는 건 매우 어렵다. ‘AI 레디 데이터’를 만드는 작업은 매우 번거롭고 관리하기 힘들다. 기업의 생성형 AI 활용이 힘든 주요 이유다.
이에 스노우플레이크가 LLM과 AI 에이전트에게 정확한 비즈니스 맥락을 쉽게 알려주고, 필요한 때 알아서 외부 지식까지 양껏 부어넣을 수 있는 기술을 선보였다.
스노우플레이크는 3일 미국 샌프란시스코에서 열린 ‘스노우플레이크 서밋 2025’에서 스노우플레이크 마켓플레이스에 기업들의 AI 도입을 지원하는 새로운 에이전틱 제품을 추가했다고 발표했다.
스노우플레이크는 ‘시맨틱 모델 공유’ 기능을 프라이빗 프리뷰로 공개했다. AI 지원 내부 데이터 세트 또는 타사 구조화 데이터를 AI 어시스턴트 및 에이전트 시스템에 쉽게 통합할 수 있게 해준다. 공유 데이터의 시맨틱 모델 생성에 시간과 노력을 들일 필요가 없다. 내부 데이터 소유자, SaaS 제공업체 또는 상용 데이터 제공업체 등 어떤 업체에서 데이터를 공유하든, 이제 팀은 자연어를 사용해 데이터와 소통할 수 있게 된다.
기업 고객은 내부 데이터는 물론 카토(CARTO), 리서치업체 CB인사이트, 금융업체 코탈리티(Cotality) 등 외부 업체의 ‘AI레디(AI-ready)’ 정형 데이터를 스노우플레이크 코텍스 AI(Snowflake Cortex AI) 앱과 에이전트에 유연하게 통합할 수 있다. 데이터 거버넌스를 유지하면서 기업 내부 마켓플레이스와 스노우플레이크 마켓플레이스에서 시맨틱 모델에 접근할 수 있는 것으로, 여기에 내부 데이터를 매핑하면 고객들은 더욱 일관되면서도 빠른 의사결정을 내릴 수 있게 된다. 이에 따라 현업에서는 데이터 엔지니어 및 사이언티스트의 지원 없이도 리포트 생성이나 추가 쿼리 실행을 할 수 있게 된다. 또한 스노우플레이크 마켓플레이스에서 제공되는 코텍스 AI레디 데이터 제품을 통해 업계 표준의 인텔리전스를 즉시 활용할 수 있다.
시맨틱 모델 공유 기능은 더불어 각 조직이 시맨틱 모델을 생성하는 데 소요되는 시간과 노력을 줄이면서도 AI 시스템이 정확하고 품질 높은 맥락에 맞는 결과를 생성하는 것을 보장한다. 사용자는 코텍스 애널리스트, 코텍스 에이전트, 스노우플레이크 인텔리전스 등 코텍스 AI 기반의 앱과 에이전트 내에서 ‘시맨틱 모델 공유 기능’을 활용해 데이터를 자연어로 질문하고 응답받을 수 있다.
루이 리 스노우플레이크 APJ 솔루션 엔지니어링 시니어 매니저는 “원래 BI 도구와 데이터 사이에 시맨틱 모델이 있어서, 비즈니스 유저의 질문에 더 정확한 결과를 보여주도록 하게 한다”며 “작년 공개된 스노우플레이크의 시맨틱 모델은 YAML 파일로 일일이 작성해야 했지만, 이제 UI로 만들 수 있고, 시맨틱 모델을 한 번만 한 곳에서 쓰는 데 그치지 않고 데이터 제품과 합쳐서 마켓플레이스를 통해 제공도 할 수 있게 됐다”고 설명했다.
그는 “코텍스 애널리스트에 질문할 때 시맨틱을 따로 만들지 않고, 이미 만들어져서 공유된 시맨틱을 가져오면 바로 할 수 있는 것”이라며 “이를 통해 AI는 더욱 정확한 답변을 해줄 수 있게 된다”고 덧붙였다.
일반 공개 예정인 ‘코텍스 날리지 익스텐션’은 고객들이 뉴스 및 콘텐츠 등 외부 업체의 비정형 데이터를 기업의 AI 애플리케이션과 에이전트에 사용할 수 있도록 한다. 이때 공유되는 외부 콘텐츠에는 정확한 출처가 표기되며 지식재산권을 보호한다. AP통신, USA투데이 네트워크 등의 뉴스 콘텐츠와 CB인사이트(CB Insights), 팩트(Packt), 스택 오버플로우 등 리서치 기관 데이터가 포함된다.
루이 리 시니어 매니저는 “문서 데이터나 웹의 커뮤니티 대화 내용, 뉴스 등 기업 외부의 정보를 별도의 RAG 없이 벡터화해서 가져오고, 질문에서 원하는 답변을 한번에 다 검색할 수 있게 된다”며 “예를 들어 어느 달 매출의 특별한 변화 상황의 원인을 AI에 질문하면, 내부 판매 데이터 조회뿐 아니라 뉴스 기사나 웹상 정보 같은 외부 지식을 알아서 검색해서, 원인까지 알려줄 수 있다”고 말했다.
기업 고객들은 필요한 데이터를 구매해 코텍스 에이전트, 코텍스 서치, 스노우플레이크 인텔리전스 등 스노우플레이크의 AI 솔루션인 ‘코텍스 AI’ 기반의 앱과 에이전트를 맥락화해 더욱 향상된 AI 결과를 확보할 수 있게 된다. 콘텐츠 소유자와 퍼블리셔는 뉴스, 보고서 등의 각종 문서를 스노우플레이크 마켓플레이스에 등록해 수익을 창출할 수 있게 된다. 정식 라이선스를 보유한 콘텐츠는 보상 또는 적절한 출처 표기 없이 AI 학습에 무단 활용될 수 없도록 했다. ‘코텍스 널리지 익스텐션’은 검색증강생성(RAG) 방식으로만 콘텐츠 접근을 허용하며 ‘스노우플레이크 제로 ETL’ 기능을 활용하면 콘텐츠 소유자와 퍼블리셔가 언제든지 콘텐츠 접근 권한을 철회할 수도 있다.
스노우플레이크는 마켓플레이스의 활용도를 더욱 확장하기 위해 ‘에이전틱 네이티브 앱(Agentic Native Apps)’을 선보인다. 에이전틱 네이티브 앱은 고객과 데이터 제공업체의 데이터를 기반으로 독립적 에이전틱 경험을 제공할 뿐만 아니라 코텍스 에이전트 및 스노우플레이크 인텔리전스에서 자체 개발한 에이전틱 앱을 위한 빌딩 블록으로 활용할 수 있는 상호 운용 가능한 에이전틱 제품이다. 데이터 제공업체는 스노우플레이크 마켓플레이스에서 에이전틱 네이티브 앱을 쉽게 구축, 공유 및 수익화할 수 있다. 또 기업 고객은 이를 간편하게 검색, 구매, 설치해 가치 창출 시간을 단축할 수 있다.
스노우플레이크 마켓플레이스는 2025년 4월 30일 기준 750개 이상의 제공업체가 3000여 개의 즉시 사용할 수 있는 데이터 세트, 앱, 에이전틱 제품을 공유 및 판매하고 있다.
크리스티안 클라이너만 스노우플레이크 제품 총괄부사장(EVP)은 “많은 조직에서 가장 많이 듣게 되는 질문 중 하나가 ‘AI는 준비됐지만 데이터는 아직 없다’는 것”이라며 “모델에 더 많은 컨텍스트를 제공할수록 더 나은 결과를 얻을 수 있으며, 스노우플레이크 고객은 이미 시맨틱 뷰를 만족스럽게 사용하고 있다”고 말했다.
그는 “시맨틱 뷰 자체만으로는 큰 도움이 되지 않는다고 생각했으며, 스노우플레이크 마켓플레이스나 내부 마켓플레이스를 통해 시맨틱 뷰를 공유할 수 있게 한다”며 “이제 조직 내에서 데이터 제품을 게시하는 데 그치지 않고, AI에 즉시 대응할 수 있는 데이터 제품을 게시하고 공유할 수 있다”고 강조했다.
그는 “정형 데이터와 마찬가지로 비정형 데이터에도 동일한 문제가 발생하므로, 코텍스 널리지 익스텐션으로 조직 외부의 비정형 데이터를 AI에 준비된 상태로 가져와 바로 활용할 수 있게 했다”며 “내부 데이터, 써드파티 데이터, 정형 데이터 또는 비정형 데이터 등 어떤 형태든 상관없이 AI에 적합한 데이터를 준비하는 것은 매우 중요하다”고 덧붙였다.
글. 바이라인네트워크
<샌프란시스코(미국)=김우용 기자>yong2@byline.network