AWS, AI 에이전트용 데이터 컨텍스트 통합 서비스 발표

아마존웹서비스(AWS)는 AI 에이전트가 신뢰할 수 있는 데이터 컨텍스트를 확보하도록 지원하는 신규 서비스 ‘AWS 컨텍스트’를 22일 발표했다.

AI 에이전트의 성능은 활용 가능한 컨텍스트의 범위에 좌우된다. 오늘날 이러한 컨텍스트는 데이터 레이크, 데이터웨어하우스, 레이크하우스. 데이터베이스, 데이터 스트림 등 전반에 분산돼 있으며, 문서화되지 않은 조직 내 지식에도 흩어져 있다. AWS는 이러한 문제를 해결하기 위해 AWS 뉴욕 서밋에서 AI 에이전트가 신뢰할 수 있는 컨텍스트를 활용할 수 있도록 지원하는 새로운 기능과 서비스를 발표했다.

AWS 컨텍스트는 기업이 보유한 기존 데이터 간의 관계를 지식 그래프로 자동 매핑하고 에이전트 기반 검색을 제공하는 서비스다. 이를 통해 조직 내 AI 에이전트는 거버넌스가 적용된 데이터 관계와 비즈니스 규칙, 도메인 지식에 안전하게 접근할 수 있다. 또한 데이터 스튜어드와 큐레이터는 콘솔에서 추론된 관계를 검토하고 이를 운영 환경에 반영하거나, 비즈니스 정의·사용 규칙 등 도메인별 지식을 추가해 그래프를 관리한다.

AWS 컨텍스트는 수십만 사용자가 매일 활용하는 아마존 퀵의 기반 기술인 지식 그래프를 확장한 서비스다. 아마존 퀵의 지식 그래프는 데이터셋, 대시보드, 메타데이터를 체계적으로 연결·관리하며, 사용 패턴을 학습해 사용자 경험을 지속적으로 향상한다.

해당 지식 그래프는 이미 하루 수백만 건의 요청을 처리하고 있다. AWS 컨텍스트로 기존의 개인 단위 지식 그래프를 조직 단위 지식 그래프로 확장하고, 조직 내 에이전트와 애플리케이션이 활용할 수 있는 공유형 컨텍스트 계층을 제공하며, 거버넌스와 관리 기능도 함께 지원한다.

기존 아마존 퀵 사용자는 AWS 컨텍스트를 즉시 활용할 수 있다. AWS 컨텍스트를 활성화하면 퀵의 에이전트는 더 광범위한 엔터프라이즈 지식 그래프에 접근할 수 있다. 여기에는 시스템 간 관계, 비즈니스 규칙, 그리고 개별 사용자의 개인 지식 그래프를 넘어 조직 차원에서 관리되는 다양한 컨텍스트가 포함된다.

AWS 글루 데이터 카탈로그, 아마존 세이지메이커 유니파이드 스튜디오, AWS 레이크 포메이션 등이 지식 그래프와 통합된다. 조직은 비즈니스 규칙과 권한 정책에 따라 지식 그래프를 관리할 수 있으며, AI 지원 기능 또는 수동 큐레이션을 통해 새로운 컨텍스트를 지속적으로 추가할 수 있다.

AWS 컨텍스트는 에이전트가 사용할수록 더욱 정교해진다. 에이전트가 지식 그래프를 질의하는 과정에서 어떤 데이터 소스가 정확한 결과를 제공하는지, 어떤 조인 경로(join path)를 주로 활용하는지, 어떤 큐레이션 규칙이 적용되는지를 지속적으로 파악한다. 또한 실제 사용 현황을 기반으로 데이터 소스의 우선순위를 평가하고, 학습한 내용을 조직 전반에 공유한다. 이를 통해 하나의 에이전트가 올바른 조인 경로를 찾거나 스키마의 모호성을 해소하면, 다른 에이전트도 별도의 수동 작업 없이 이를 활용할 수 있다.

AWS 컨텍스트는 정형·비정형 데이터의 핵심 메타데이터를 아마존 S3 테이블의 아파치 아이스버그 형식으로 게시한다. 이를 통해 사용자는 아마존 아테나, 아마존 레드시프트, 아파치 스파크 등 아이스버그 호환 엔진으로 컨텍스트를 조회하고 이를 기반으로 시스템을 구축, 감사하거나 마이그레이션할 수 있다.

AWS 컨텍스트는 외부 카탈로그와도 연동하도록 설계돼 AWS 외부 시스템의 컨텍스트를 동일한 지식 그래프에 통합할 수 있다. 에이전트는 에이전틱 검색 API와 MCP 도구를 통해 해당 컨텍스트를 활용할 수 있으며, 이는 아마존 베드록 에이전트코어 기반 환경, 아마존 EKS 배포 환경, 또는 MCP 호환 프레임워크 환경 등에서 동일하게 지원된다. 사용자의 컨텍스트는 아파치 아이스버그 형식을 통해 계속해서 조회하고 이식할 수 있으며, 사용자가 전적으로 통제한다.

프로덕션에 투입되는 모든 에이전트에는 거버넌스 문제가 따른다. 어떤 데이터에 접근할 수 있는지, 누구의 권한으로 무엇에 접근했는지 증명할 수 있는지가 핵심이다. AWS 컨텍스트는 모든 질의를 신원 기반으로 처리하여 이 문제에 대응하며, 각 호출에는 요청자의 AWS IAM과 AWS 레이크 포메이션 권한이 그대로 적용되어 에이전트가 자신의 신원에 허용된 데이터와 관계만 접근·탐색하도록 한다. 접근이 신원을 거치므로 모든 상호작용을 감사할 수 있다. 보안 및 컴플라이언스 팀은 기존에 사용하던 통제 체계를 활용해 에이전트가 어떤 데이터에 접근했는지, 그리고 어떤 권한에 기반해 접근했는지를 확인할 수 있다.

AWS는 AWS 글루 데이터 카탈로그를 위한 비즈니스 컨텍스트 및 시맨틱 검색 기능의 프리뷰도 공개했다. 사용자는 이제 S3 테이블을 기반으로 하는 리소스를 포함해 AWS 글루 데이터 카탈로그의 테이블, 뷰, 컬럼에 비즈니스 설명, 용어집 항목, 사용자 정의 메타데이터를 추가할 수 있다. 또한 카탈로그 외부에 저장된 추가 데이터 컨텍스트를 제공하는 스킬 에셋과 연계할 수 있다. 비즈니스 컨텍스트가 AWS 글루 데이터 카탈로그 내 기술 메타데이터와 함께 인덱싱됨에 따라, 고객은 새로운 글루 검색 API(Glue Search API)를 활용해 비즈니스 의미를 기준으로 데이터를 더욱 신속하게 검색할 수 있다. 또한 AI 에이전트는 추론을 위해 컨텍스트를 추정하는 대신 신뢰할 수 있는 정의를 기반으로 보다 정확하게 추론할 수 있다.

AWS는 글루 데이터 카탈로그의 스킬 에셋 프리뷰도 함께 공개했다. 데이터 생산자는 AI 스킬, 가이드 마크다운 파일, 팀 런북 등 S3, 깃 저장소, 위키 등에 위치한 파일을 가리키는 URI를 참조하는 신규 자산 유형인 스킬 에셋을 만들 수 있다. 데이터 자산에 스킬 에셋을 연결하면 에이전트마다 프롬프트로 반복해서 학습시킬 필요 없이 필요한 컨텍스트와 지침을 점진적으로 제공할 수 있다.

AWS 에이전트 툴킷은 글루 데이터 카탈로그, 아마존 아테나, S3 테이블과 같은 서비스 및 기능을 활용할 수 있도록 기본 스킬을 제공한다. 개발자는 완전관리형 원격 AWS MCP에 연결하거나 클로드 코드, 커서, 아마존 키로용 AWS 데이터 분석 플러그인을 설치해 에이전트가 데이터를 찾고 분석하거나 그 위에 애플리케이션을 구축하도록 요청할 수 있다. 에이전트코어 하네스로 구축된 에이전트는 한 줄의 코드만으로 AWS 에이전트 툴킷의 모든 AWS 스킬에 접근할 수 있다.

AWS는 고객이 데이터 레이크에 자체 컨텍스트를 보다 쉽게 추가할 수 있도록 아마존 S3 애노테이션을 정식 출시했다. S3 애노테이션은 풍부하고 조회 가능한 비즈니스 컨텍스트를 S3 객체에 직접 첨부해 S3 아이스버그 테이블에 저장하는 방식이다. 객체 하나당 최대 1GB의 컨텍스트를 담을 수 있으며 내용을 수정할 수 있어 데이터 변화에 따라 컨텍스트도 함께 발전시킬 수 있다.

S3 애노테이션은 S3 객체와 함께 저장되기 때문에 복사·복제 작업 시 객체와 함께 이동하며 객체가 삭제되면 함께 제거된다. 별도의 메타데이터 데이터베이스를 구축, 동기화하거나 최신 상태로 유지할 필요가 없다. 또한 S3용 관리형 아파치 아이스버그 테이블 인프라인 S3 메타데이터를 통해 조회할 수 있다. 버킷에서 애노테이션 테이블을 활성화하면 모든 애노테이션이 JSON, XML, YAML 등 어떤 구조로 작성하든 완전관리형 아이스버그 테이블로 자동 반영된다. 고객은 아마존 아테나, 아마존 레드시프트 등 아이스버그 호환 엔진으로 모든 객체를 조회할 수 있고, 에이전트는 S3 테이블 MCP 서버로 자연어로 애노테이션을 탐색할 수 있다.

AWS는 “컨텍스트를 AI 에이전트를 위한 데이터 레이크로 정의하며, 이번 혁신을 통해 모든 규모의 조직과 기업에서 데이터와 상호작용하는 AI 에이전트를 위한 지식과 인텔리전스의 기반을 구축하고 있다”고 밝혔다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network